Google предоставит разработчикам приложений доступ к Gemini Nano для искусственного интеллекта на устройстве.

Быстрый рост генеративных ИИ преобразует то, как технологические гиганты вроде Google создают свои продукты; многие из функций искусственного интеллекта, с которыми вы сталкивались, работают на мощных удаленных серверах вместо вашего устройства. Тем не менее, похоже, что Google готовится предоставить разработчикам инновационные мобильные инструменты для ИИ в ближайшем будущем. На следующей неделе на I/O ожидается представление новой коллекции API, которые позволят разработчикам использовать возможности Gemini Nano для обработки данных ИИ непосредственно на устройствах.

💰

"Рынок красный? Это просто сезон скидок для умных инвесторов." - так говорят, чтобы не плакать. У нас — аналитика, которая помогает плакать реже.

Найти недооцененные активы

Google незаметно опубликовал руководство о значительных новых возможностях ИИ для программистов. Согласно Android Authority, будет обновление ML Kit SDK, которое включает поддержку API для генеративных функций искусственного интеллекта на устройстве с помощью Gemini Nano. Это основано на AI Core и похоже на экспериментальный Edge AI SDK, но интегрируется с уже существующей моделью, предлагая набор предопределенных характеристик, которые разработчики найдут простыми в реализации.

API GenAI от ML Kit Google позволяют приложениям выполнять задачи как обобщение текста, исправление ошибок, переписывание контента и описание изображений без необходимости передачи данных в облако. Однако важно отметить, что Gemini Nano, который не обладает такой же мощностью, как его облачная альтернатива, может иметь определенные ограничения. Например, созданные резюме могут содержать максимум три пункта списка, а описания изображений будут доступны только на английском языке. Качество выходных результатов также может отличаться в зависимости от версии Gemini Nano, установленной на устройстве. Существуют две версии: стандартная (Gemini Nano XS) размером примерно 100 МБ и меньшая версия (Gemini Nano XXS), которая встречается на Pixel 9a и составляет лишь четверть размера стандартной версии. Учтите, что Gemini Nano работает только с текстом и имеет значительно более узкое окно контекста по сравнению с облачной версией.

Это решение выгодно для Android в целом, поскольку ML Kit совместим с устройствами не только серии Google Pixel. В то время как устройства Pixel активно используют Gemini Nano, многие другие бренды вроде OnePlus 13, Samsung Galaxy S25 и Xiaomi 15 уже готовы к запуску этой модели. По мере того как все больше телефонов начинают использовать модель искусственного интеллекта от Google, разработчики смогут расширить свой охват, создавая функции генеративного ИИ для более широкого спектра устройств.

Теперь документация доступна для изучения разработчиками. Мы ожидаем, что Google раскроет API на своем мероприятии I/O. Компания официально анонсировала сессию на I/O под названием «Gemini Nano on Android: Building with on-device general AI». Описание подразумевает введение новых API, способных «конденсировать, редактировать и перефразировать текст, а также создавать описания изображений», что кажется идеально согласующимся с функциями последних ML Kit API.

Важная часть головоломки ИИ

Разработчики, стремящиеся включить генеративные возможности искусственного интеллекта на уровне устройства в приложения для Android, сталкиваются с непростой ситуацией. SDK Google AI Edge предлагает доступ к аппаратному обеспечению NPUs для выполнения моделей, но он находится в экспериментальной стадии и ограничен устройствами серии Pixel 9, поддерживая только текстовые задачи. В то же время Qualcomm и MediaTek предоставляют API для обработки нагрузок ИИ, однако эти функции могут существенно различаться между различными моделями устройств, делая их неподходящим выбором для долгосрочных проектов. Более того, разработка и развертывание собственной модели требуют глубокого понимания генеративных систем искусственного интеллекта. Введение новых API нацелено на упрощение процесса внедрения местного искусственного интеллекта, обещая более простой опыт.

Хотя модель ИИ на устройстве может иметь меньше возможностей по сравнению с облачными моделями, она играет критически важную роль в том, чтобы сделать ИИ более удобным и безопасным для пользователя. Многие предпочитают сохранять свои личные данные локально вместо отправки их на удалённый сервер для обработки. Модель на устройстве способна обеспечить более безопасное обработку информации, поскольку анализ происходит непосредственно на самом устройстве. Например, Google Pixel анализирует все скриншоты прямо на телефоне пользователя, а Motorola суммирует уведомления локально в новом складном смартфоне Razr Ultra, гарантируя приватность и безопасность данных. В противоположность этому, менее продвинутая модель, такая как базовая Razr, отправляет уведомления для обработки на сервер, что может вызвать опасения по поводу приватности данных и безопасности.

Использование API совместимых с Gemini Nano может обеспечить желанное единообразие мобильного искусственного интеллекта, но это зависит от сотрудничества между Google и производителями устройств для поддержки Gemini Nano. Некоторые компании могут выбрать независимые пути развития, что приведет к тому, что множество телефонов не будут иметь достаточной мощности для локального выполнения AI.

Смотрите также

2025-05-16 21:54