Клод из Anthropic теперь может управлять компьютерами, как это делают люди

Как опытный аналитик с опытом работы в области искусственного интеллекта и машинного обучения, я должен сказать, что достижения Anthropic с Claude 3.5 Sonnet и Haiku просто выдающиеся. Повышение производительности и новые функции демонстрируют стремление компании расширить границы возможностей искусственного интеллекта, особенно в задачах кодирования.

Во вторник система искусственного интеллекта Anthropic, Claude 3.5 Sonnet, демонстрирует существенное повышение производительности, поскольку компания выпускает усовершенствованную и переработанную версию модели в тандеме с компактной Claude 3.5 Haiku. В этом обновлении Sonnet представлена бета-функция, которая дает ИИ некоторый контроль над компьютером, на котором он работает. Проще говоря, Anthropic обновила свой впечатляющий искусственный интеллект Claude 3.5 Sonnet, улучшив его производительность и предложив новую бета-функцию, позволяющую искусственному интеллекту управлять компьютером, на котором он работает.

В своей предыдущей форме Claude 3.5 Sonnet превосходно справлялся с задачами кодирования. Однако последняя версия демонстрирует существенные улучшения во многих областях, постоянно превосходя Gemini 1.5 и GPT-4o в различных отраслевых тестах. Интересно, что только Gemini 1.5 Pro удалось превзойти новый Claude 3.5 Sonnet в конкретных тестах, особенно в тесте MATH.

Рекомендуемые видео

Несмотря на компактные размеры, будущая модель 3.5 Haiku не стесняется своих возможностей. Выпуск которого запланирован на этот месяц, он превосходит по производительности Claude 3.0 Opus, нашу крупнейшую модель предыдущего поколения. Подобно своему более крупному аналогу, новый Haiku превосходно справляется с задачами кодирования, получив оценку 40,6% на тесте SWE-bench Verified. Это превосходит как GPT-40, так и оригинальный Sonnet 3.5.

Значительно усовершенствованный, обновленный Claude 3.5 Sonnet теперь интегрируется с настольными приложениями через API «Использование компьютера». Этот ИИ способен производить соответствующие нажатия клавиш, щелчки мыши и движения, имитирующие взаимодействие человека. Важно отметить, что эта система все еще находится на экспериментальной стадии и может сталкиваться с ошибками. Цель запуска публичной бета-версии — собрать отзывы разработчиков для ускоренного улучшения функциональности API.

В своем блоге Anthropic объяснила, что они научили Клода наблюдать за действиями на дисплее и использовать программные инструменты для выполнения задач. Когда разработчики просят Клода использовать определенное компьютерное программное обеспечение и предоставить доступ, Клод изучает снимки экрана, отображаемые пользователем, а затем вычисляет, на сколько пикселей он должен переместиться по вертикали или горизонтали, чтобы курсор щелкнул в соответствующем месте.

По сути, эта сущность представляет собой продвинутый инструмент искусственного интеллекта. Он предназначен для автоматизации различных программных процессов, таких как создание и проверка потенциальных клиентов для маркетинга, выявление закономерностей и тенденций в медицинских данных или даже навигация по веб-сайтам и заполнение форм от вашего имени. По сути, он представляет собой более сложную версию существующих роботизированных систем автоматизации процессов.

Компания называет Asana, Canva, Cognition, DoorDash, Replit и The Browser Company пионерами этой инновационной функции. В качестве иллюстрации, согласно пресс-релизу, Replit использует Computer Control для «создания важного аспекта, который оценивает приложения во время их разработки для своего предложения Replit Agent».

Будьте уверены, по мнению Anthropic, на данный момент нет непосредственной опасности превращения ИИ в разрушительную силу, подобную Скайнету. Проще говоря, люди сохраняют контроль над Клодом, давая ему конкретные инструкции относительно его действий, например «использовать данные с моего компьютера и в Интернете, чтобы заполнить эту форму». Люди решают, когда и как предоставить доступ Клоду, и он переводит эти инструкции в соответствующие компьютерные команды (например, перемещение курсора, щелчок, ввод текста) для выполнения поставленной задачи.

Даже Anthropic признает возможность манипулирования Компьютерным контролем для отправки нежелательных сообщений (спама), распространения ложной информации или совершения мошенничества. Чтобы решить эту проблему, они создали инновационные классификаторы, предназначенные для определения того, когда используется их API и причиняет ли такое использование какой-либо вред.

Смотрите также

2024-10-22 23:27