
Как опытный аналитик с опытом работы в области искусственного интеллекта и машинного обучения, я должен сказать, что достижения Anthropic с Claude 3.5 Sonnet и Haiku просто выдающиеся. Повышение производительности и новые функции демонстрируют стремление компании расширить границы возможностей искусственного интеллекта, особенно в задачах кодирования.
Купил акции по совету друга? А друг уже продал. Здесь мы учимся думать своей головой и читать отчётность, а не слушать советы.
Прочитать отчет 10-KВо вторник система искусственного интеллекта Anthropic, Claude 3.5 Sonnet, демонстрирует существенное повышение производительности, поскольку компания выпускает усовершенствованную и переработанную версию модели в тандеме с компактной Claude 3.5 Haiku. В этом обновлении Sonnet представлена бета-функция, которая дает ИИ некоторый контроль над компьютером, на котором он работает. Проще говоря, Anthropic обновила свой впечатляющий искусственный интеллект Claude 3.5 Sonnet, улучшив его производительность и предложив новую бета-функцию, позволяющую искусственному интеллекту управлять компьютером, на котором он работает.
В своей предыдущей форме Claude 3.5 Sonnet превосходно справлялся с задачами кодирования. Однако последняя версия демонстрирует существенные улучшения во многих областях, постоянно превосходя Gemini 1.5 и GPT-4o в различных отраслевых тестах. Интересно, что только Gemini 1.5 Pro удалось превзойти новый Claude 3.5 Sonnet в конкретных тестах, особенно в тесте MATH.
Рекомендуемые видео
Несмотря на компактные размеры, будущая модель 3.5 Haiku не стесняется своих возможностей. Выпуск которого запланирован на этот месяц, он превосходит по производительности Claude 3.0 Opus, нашу крупнейшую модель предыдущего поколения. Подобно своему более крупному аналогу, новый Haiku превосходно справляется с задачами кодирования, получив оценку 40,6% на тесте SWE-bench Verified. Это превосходит как GPT-40, так и оригинальный Sonnet 3.5.

Значительно усовершенствованный, обновленный Claude 3.5 Sonnet теперь интегрируется с настольными приложениями через API «Использование компьютера». Этот ИИ способен производить соответствующие нажатия клавиш, щелчки мыши и движения, имитирующие взаимодействие человека. Важно отметить, что эта система все еще находится на экспериментальной стадии и может сталкиваться с ошибками. Цель запуска публичной бета-версии — собрать отзывы разработчиков для ускоренного улучшения функциональности API.
В своем блоге Anthropic объяснила, что они научили Клода наблюдать за действиями на дисплее и использовать программные инструменты для выполнения задач. Когда разработчики просят Клода использовать определенное компьютерное программное обеспечение и предоставить доступ, Клод изучает снимки экрана, отображаемые пользователем, а затем вычисляет, на сколько пикселей он должен переместиться по вертикали или горизонтали, чтобы курсор щелкнул в соответствующем месте.
По сути, эта сущность представляет собой продвинутый инструмент искусственного интеллекта. Он предназначен для автоматизации различных программных процессов, таких как создание и проверка потенциальных клиентов для маркетинга, выявление закономерностей и тенденций в медицинских данных или даже навигация по веб-сайтам и заполнение форм от вашего имени. По сути, он представляет собой более сложную версию существующих роботизированных систем автоматизации процессов.
Компания называет Asana, Canva, Cognition, DoorDash, Replit и The Browser Company пионерами этой инновационной функции. В качестве иллюстрации, согласно пресс-релизу, Replit использует Computer Control для «создания важного аспекта, который оценивает приложения во время их разработки для своего предложения Replit Agent».
Будьте уверены, по мнению Anthropic, на данный момент нет непосредственной опасности превращения ИИ в разрушительную силу, подобную Скайнету. Проще говоря, люди сохраняют контроль над Клодом, давая ему конкретные инструкции относительно его действий, например «использовать данные с моего компьютера и в Интернете, чтобы заполнить эту форму». Люди решают, когда и как предоставить доступ Клоду, и он переводит эти инструкции в соответствующие компьютерные команды (например, перемещение курсора, щелчок, ввод текста) для выполнения поставленной задачи.
Даже Anthropic признает возможность манипулирования Компьютерным контролем для отправки нежелательных сообщений (спама), распространения ложной информации или совершения мошенничества. Чтобы решить эту проблему, они создали инновационные классификаторы, предназначенные для определения того, когда используется их API и причиняет ли такое использование какой-либо вред.
Смотрите также
- 20 лучших циферблатов Samsung Galaxy Watch, которые вам стоит использовать
- OnePlus 15 против Oppo Find X9 Pro: Флагманы в сравнении
- 6 лучших планшетов для путешествий в 2024 году
- Сравнение камер Samsung Galaxy S25 Plus и OnePlus 13
- Я думал, что этот Android-телефон за 250 долларов станет катастрофой. Это не было
- Apple’s AirPods Max 2 принесут чип H2, улучшенную ANC в апреле за 549 долларов.
- Marvel официально подтверждает дизайн Майлза Моралеса для нового облика Человека-паука.
- Супергеройский шедевр Prime Video Invincible продолжает идеальную тенденцию Rotten Tomatoes.
- Oppo Find X9 Pro vs Find X9: Сравнение серии
- 4-й сезон ‘Invincible’ от Prime Video получил оценку на Rotten Tomatoes.
2024-10-22 23:27