Как энтузиаст технологий с многолетним опытом за плечами, я должен признать, что перспектива проекта Google Project Jarvis меня очень волнует. Идея агента искусственного интеллекта в браузере Google Chrome, способного выполнять общие задачи с большей независимостью, кажется гигантским шагом вперед с момента ее создания в 2008 году.
Одной из последних тенденций в области генеративного ИИ являются агенты ИИ, и Google, возможно, готовит своего собственного агента для включения в предстоящую модель большого языка Gemini (LLM).
Project Jarvis — это продвинутый инструмент искусственного интеллекта, интегрированный непосредственно в Google Chrome, способный выполнять рутинные задачи после коротких запросов или команд. Эта интеграция может означать значительный сдвиг, потенциально представляющий собой самое существенное обновление Chrome с момента его первого запуска в 2008 году, как сообщает The Information.
Рекомендуемые видео
Существующая модель Google Gemini 1.5 Pro демонстрирует свой потенциал как помощника по покупкам и планировщика путешествий с помощью чат-бота Gemini Advanced. Будущие разработки, такие как Project Jarvis, направлены на расширение этих возможностей, позволяя ему выполнять такие задачи, как просмотр веб-сайтов, заполнение форм и обработка платежей на основе запросов пользователей, тем самым полностью возвращаясь к помощи пользователям различными способами.
Например, модель Gemini 1.5 Pro сможет выполнить запрос «запланировать мне отпуск в декабре с бюджетом в 2000 долларов»; Project Jarvis, вероятно, сможет выполнить запрос «запланируйте мне отпуск в декабре с бюджетом в 2000 долларов». Забронируйте авиабилеты и отель и пришлите подробности на мою электронную почту», — отметил Tom’s Guide.
Как исследователь, я рад углубиться в продолжающееся развитие нашей системы, которую ласково называют «Джарвис» — дань уважения ИИ-помощнику Тони Старка из «Железного человека». Хотя его официальное название остается нераскрытым, кодовое имя кажется подходящим, поскольку Google продолжает оснащать его расширенными функциями.
На своей ежегодной конференции разработчиков ввода-вывода Google, состоявшейся в мае, компания Google поделилась информацией о своих агентах искусственного интеллекта (ИИ). Эти агенты помогут обрабатывать как аудио, так и визуальный контент, например речь и видео, тем самым ускоряя время реакции во время взаимодействия.
Было упомянуто, что Project Jarvis потенциально может стать одной из новых функций в предстоящем LLM от Google, который, как предполагается, будет обновленной версией под названием Gemini 2.0. Возможное объявление об этом генеративном ИИ может состояться в начале декабря; однако, согласно The Information, подробности о его доступности еще не подтверждены.
Google может вскоре представить своего собственного помощника с искусственным интеллектом, но несколько других брендов уже представили версии аналогичной технологии. Например, компания Anthropic недавно представила своего агента использования компьютера, позволяющего Клоду LLM выступать в качестве автономного пользователя устройства для выполнения задач. Эта функция все еще находится на стадии бета-тестирования. Между тем, Swarm Framework от OpenAI представляет собой набор агентов, которые сотрудничают для выполнения задач. В компании уточнили, что эта технология пока находится на стадии экспериментальных исследований.
Смотрите также
- Huawei Watch GT 5 против GT 4: стоит ли обновлять свое носимое устройство?
- Концовка «Субстанции» объясняет: что происходит со Сью и Элизабет?
- Я не думаю, что Apple хочет, чтобы я купил новый iPad Pro
- О RTX 5090 только что появился действительно многообещающий слух
- Обзор LG Dual Mode OLED: действительно единственный в своем роде игровой монитор
- Лучшие защитные пленки для экрана Apple iPhone 16 Pro Max 2024 года
- Amazon «нарастит» рекламу Prime Video в 2025 году
- Обзор саундбара LG S95TR: наконец-то хорошо
- Невоспетый герой модернизации ноутбуков с Windows
- На подходе еще больше Джейсона Вурхиза, но не так, как вы думаете
2024-10-30 02:27