Apple работает над тем, чтобы поместить огромную модель Gemini в iPhone для питания новой Siri.

Генеративный ИИ сейчас повсюду в технологиях, но Apple медленнее внедряет его. Хотя Apple изначально планировала ИИ-управляемую Siri на 2024 год, она столкнулась с задержками. Теперь они сотрудничают с Google, чтобы интегрировать Gemini в Siri позднее в этом году. Поскольку Apple готовится к своей Всемирной конференции разработчиков, они работают над тем, чтобы привнести мощные функции ИИ на iPhone, даже с их ограниченной вычислительной мощностью. Однако некоторые пользователи Apple могут быть не в восторге от изменений.

💰

"Рынок красный? Это просто сезон скидок для умных инвесторов." - так говорят, чтобы не плакать. У нас — аналитика, которая помогает плакать реже.

Найти недооцененные активы

Apple последовательно подчеркивала преимущества конфиденциальности при обработке задач ИИ непосредственно на своих устройствах. Однако, недавний отчет указывает на то, что новая Siri на iPhone, работающая на Gemini, будет в значительной степени полагаться на облачные сервисы Google и Nvidia, несмотря на предыдущий акцент Apple на локальной обработке ИИ. Похоже, это отход от приверженности Apple к ИИ на устройстве по причинам конфиденциальности.

Каждый раз, когда выходит новый компьютерный чип, производители рекламируют его возможности искусственного интеллекта — даже Apple подчеркивает улучшения своего Neural Engine. Этот маркетинг часто предполагает, что смартфоны могут легко запускать сложные AI-программы, но это не всегда так. Удивительно, но стандартные графические процессоры в большинстве телефонов на самом деле лучше справляются с AI-задачами, чем специализированные AI-чипы. Хотя такие компоненты, как Neural Engine от Apple, созданы для умного и эффективного AI, телефонам все еще не хватает памяти для загрузки и запуска действительно больших AI-моделей.

Даже самые мощные модели ИИ пока не являются достаточно полезными помощниками, что создает трудности для запуска ИИ непосредственно на устройствах, таких как телефоны. Модели ИИ для телефонов намного меньше, с всего лишь несколькими миллиардами параметров, в то время как новейшие модели от таких компаний, как Google, могут иметь триллионы. Чтобы они работали быстрее на устройствах, эти локальные модели также жертвуют некоторой точностью. В результате ИИ на телефонах не кажется таким же способным, как ИИ, работающий в облаке, и даже эти более крупные облачные модели не всегда очень умны.

Поразительный, уменьшающийся Gemini

Google предлагает уменьшенную версию своего ИИ Gemini, под названием Gemini Nano, специально для телефонов. Но эта версия в основном используется для быстрых задач, таких как предоставление полезных предложений или суммирование аудио. Siri, тем не менее, создана как полноценный разговорный помощник – с ним ведется диалог, чтобы выполнить задачи. Это другой подход, требующий более мощного ИИ. Фактически, на телефонах Android, вопрос к Gemini *всегда* отправляется на серверы Google в облаке.

Как только Apple завершила свое соглашение с Google, она начала процесс упрощения больших AI-моделей Gemini от Google. Это упрощение, называемое дистилляцией, создает меньшую, более эффективную модель, которая учится функционировать как оригинальная, более крупная. Со временем это позволяет меньшей модели приобретать полезные возможности, удаляя при этом ненужные данные. Это потенциально может позволить Siri обрабатывать некоторые запросы непосредственно на вашем устройстве, хотя, вероятно, она по-прежнему будет полагаться на облачные вычисления для многих задач.

Apple может столкнуться с проблемами при обработке ИИ из-за своей зависимости от облачных сервисов. Хотя ожидается, что Apple подчеркнет свой опыт в разработке чипов на предстоящем мероприятии WWDC, новый отчет предполагает, что у компании возникли трудности с запуском больших AI-моделей Gemini от Google на собственной внутренней серверной инфраструктуре, которая использует ее чипы M-серии.

Следующая версия Siri, вероятно, будет обрабатывать сложные запросы с использованием облачных сервисов Google вместо собственных разработок Apple. Однако, Apple не будет использовать специализированные процессоры Google (TPU) для этого. Вместо этого, Apple заключила партнёрство с Nvidia и будет использовать платформу Nvidia Confidential Computing. Эта технология сохраняет пользовательские данные зашифрованными даже во время обработки в облаке, позволяя Apple подчеркнуть свою приверженность конфиденциальности пользователей. Apple также может продолжить брендировать эту систему под своим названием ‘Private Cloud Compute’.

Вряд ли вы сможете определить, использует ли Siri последнюю AI-модель Gemini для каждого запроса. Компании, разрабатывающие устройства как с локальным, так и с облачным AI, стремятся к плавному, унифицированному опыту. Однако могут быть некоторые тонкие признаки, указывающие на используемую версию.

Большие AI-модели часто медленно реагируют, тратя время на генерацию результатов. Хотя технология безопасных вычислений от Nvidia уделяет приоритетное внимание конфиденциальности, она может еще больше замедлить обработку. Вы можете заметить эту задержку с голосовыми помощниками, такими как Siri, при подключении к удаленным серверам. Однако запуск AI локально на вашем устройстве имеет ограничения, поскольку для работы наиболее мощным моделям по-прежнему требуются дорогостоящие, высокопроизводительные серверы.

Смотрите также

2026-05-28 23:56