Новый ИИ-агент Perplexity может выполнять многоэтапные задачи на вашем устройстве Android.

В четверг Perplexity представила первый выпуск умного помощника с искусственным интеллектом под названием Perplexity Assistant, разработанного специально для устройств Android. Этот ИИ способен автономно выполнять сложные многоэтапные задачи от имени своего пользователя.

В четверг генеральный директор Perplexity объявил о выпуске нашего Perplexity Assistant для пользователей Android. Этот шаг означает, что мы превращаемся из просто поставщика ответов в полноценного помощника, который может взаимодействовать с другими приложениями и выполнять простые задачи от вашего имени.

В мобильном приложении Perplexity вы найдете полезного помощника, который работает с использованием нашей текущей модели «системы ответов». Это означает, что Ассистент может подключаться к Интернету для получения информации. Подобно новой функции «Задачи» ChatGPT, пользователям будет предоставлена ​​возможность планировать напоминания и будущие действия с помощью этого инструмента. Например, помощник может автоматически создать запись в календаре о предстоящем событии от вашего имени в подходящее время и дату.

Пользователи могут использовать этот инструмент не только для долгосрочных задач, но и для оперативных действий, таких как вызов службы такси или поиск определенной песни. Более того, компания отметила, что обновленная функция обеспечивает доступ к вашей камере, то есть, в принципе, вы можете попросить ее найти рестораны поблизости и даже забронировать для вас столик.

Помощник Perplexity поставляется бесплатно в мобильном приложении и изначально поддерживает 15 языков, включая английский, испанский, французский, немецкий, японский, корейский, хинди и другие. Его совместимость с другими интеллектуальными искусственными интеллектами на устройстве, такими как Gemini или ChatGPT Tasks, еще предстоит протестировать.

В сфере генеративного искусственного интеллекта агенты являются последней тенденцией. Эти гибкие модели часто основаны на более крупных моделях изучения языка (LLM), таких как ChatGPT, Claude или Gemini. В отличие от своих аналогов, генерирующих контент, эти агенты предназначены для анализа данных и действуют автономно. Их действия могут варьироваться от простых задач, таких как автоматическая расшифровка собрания Zoom, до сложных, таких как организация обеда из 8 блюд, покупка ингредиентов с помощью Instacart и отправка приглашений вашим гостям по электронной почте.

Как энтузиаст технологий, я не могу не заметить усиливающуюся конкуренцию в сфере ИИ-агентов. Все началось еще в ноябре, когда Anthropic запустила свой API для использования компьютера, позволяющий Клоду имитировать действия мыши и клавиатуры человека, тем самым управляя локальными вычислительными системами. В том же месяце Microsoft представила Copilot Actions, выпустив эти агенты для корпоративных и корпоративных подписчиков уже в январе. Не оставаясь в стороне, Nvidia продемонстрировала свое новое семейство LLM Nemotron на выставке CES 2025. А совсем недавно OpenAI официально представила Operation, своего ИИ-агента, представленного в качестве «предварительного исследования».

Смотрите также

2025-01-24 00:29