Усовершенствованная модель OpenAI «Project Strawberry» наконец-то появилась

Усовершенствованная модель OpenAI «Project Strawberry» наконец-то появилась

Как опытный исследователь с опытом работы в области искусственного интеллекта и машинного обучения, я должен сказать, что выпуск модели o1 OpenAI значительно пробудил мой интерес. Внимательно следя за развитием этих передовых моделей рассуждения, интересно видеть, как далеко мы продвинулись со времен GPT-4o.


После нескольких месяцев ажиотажа и ажиотажа OpenAI представила операционный вариант своей сложной модели рассуждения, ранее известной как Project Strawberry, а теперь называемой «o1». Наряду с этим существует версия меньшего размера, очень похожая на GPT-4o, предназначенная для обеспечения более быстрого и гибкого взаимодействия за счет отсутствия использования всеобъемлющей базы знаний.

Насколько я понимаю, модель О1 представляет собой набор передовых инноваций. Это пионер серии моделей рассуждения OpenAI, разработанных для ответа на сложные вопросы в различных областях, таких как наука, программирование и математика, со скоростью, превышающей время реакции человека.

Пример: В ходе тестирования модель о1 прошла отборочный тест на Международную олимпиаду по математике. В отличие от своего предшественника, GPT-4o, которому удалось правильно ответить только на 13% вопросов, o1 ответил правильно на 83%. В онлайн-конкурсе Codeforces o1 вошел в число 89% лучших. Кроме того, o1 может отвечать на вопросы, которые путали предыдущие модели (например, определять, что больше — 9,11 или 9,9). Однако важно отметить, что этот релиз — всего лишь краткий обзор всего потенциала модели o1.

По словам руководителя исследования OpenAI Джерри Творека, последняя версия o1 была разработана с использованием уникального алгоритма оптимизации и специально созданных обучающих данных. Об этом он поделился с The Verge. Кажется, что, используя обучение с подкреплением и рассуждения «цепочки мыслей», o1 генерирует более точные выводы по сравнению с предыдущей моделью. Творек упомянул, что у модели меньше галлюцинаций, но пояснил, что они еще не полностью решили проблему галлюцинаций.

Начиная с сегодняшнего дня подписчики ChatGPT-Plus и Teams могут опробовать продукты o1 и o1-mini. Подписчики Enterprise и Education получат доступ к этим продуктам на следующей неделе.

Компания заявляет, что o1-mini в конечном итоге станет доступна для пользователей бесплатного уровня, но не уточнила сроки. Разработчики заметят резкое увеличение цен на API для o1 по сравнению с GPT-4o. Доступ к o1 будет стоить 15 долларов за миллион входных токенов (по сравнению с 5 долларами за миллион для GPT-4o) и 60 долларов за миллион выходных токенов, что в четыре раза больше, чем плата 4o в 15 долларов за миллион. Реальный вопрос заключается в том, считает ли новая модель, что слово «клубника» содержит две буквы R или три.

Смотрите также

2024-09-12 22:27