Как исследователь с опытом работы в области искусственного интеллекта и машинного обучения, я считаю, что последняя разработка OpenAI, CriticGPT, является интригующим решением распространенной проблемы совершенствования моделей ИИ. Непрерывный процесс улучшения языковых моделей, таких как GPT-4, посредством обучения с подкреплением на основе обратной связи с человеком (RLHF), необходим для достижения более высокой производительности и точности. Однако по мере развития возможностей системы она может опережать инструкторов-людей, что затрудняет выявление ошибок и ошибок.
OpenAI создала ИИ под названием CriticGPT, специально разработанный для сотрудничества с тренерами OpenAI в улучшении модели GPT-4. Его уникальная способность заключается в выявлении сложных ошибок кодирования, которые люди потенциально могут не заметить.
После первоначального обучения продвинутая языковая модель, такая как GPT-4, проходит фазу постоянного улучшения с использованием метода под названием «Обучение с подкреплением на основе обратной связи с человеком» (RLHF). На этом этапе инструкторы-люди взаимодействуют с системой и отмечают соответствующие ответы на различные запросы, а также оценивают различные ответы относительно друг друга. Эта обратная связь позволяет модели узнать, какой ответ является предпочтительным, и повышает общую точность ответа.
По мере того, как система становится более опытной, она может превзойти уровень знаний своего инструктора, что затрудняет выявление ошибок и неточностей.
Преподаватели искусственного интеллекта из OpenAI в прошлом году не обязательно были специалистами по конкретным предметам. Однако выяснилось, что они прибегли к передаче этой задачи кенийским работникам за минимальную оплату, около 1,60 доллара в час, чтобы повысить эффективность своих моделей.
Проблема возникает, в частности, при расширении возможностей системы по генерации кода, и именно здесь CriticGPT оказывается полезным.
Как аналитик, я разработал модель CriticGPT, основанную на GPT-4, для выявления ошибок в выводе кода, генерируемого ChatGPT. Согласно нашим недавним данным, когда пользователи получают помощь от CriticGPT при просмотре кода ChatGPT, им удается превзойти тех, кто работает в одиночку, примерно в 60% случаев.
Кроме того, корпорация представила исследовательскую работу по этой теме под названием «Критики LLM превосходят людей в обнаружении ошибок LLM». Результаты показали, что LLM выявляют значительно больше ошибок в кодировании, чем квалифицированные люди, выполняющие оценку кода, а также показали, что критика модели предпочтительнее критики человека в более чем 80% случаев.
Интересно отметить, что в этом исследовании частота галлюцинативных реакций у CriticGPT снизилась при сотрудничестве с людьми. Однако оно оставалось больше, чем когда задачу выполнял только человек самостоятельно.
Смотрите также
- Huawei Watch GT 5 против GT 4: стоит ли обновлять свое носимое устройство?
- Huawei Watch GT 5 против GT 5 Pro: какие умные часы выбрать?
- Новейший планшет HUAWEI, MatePad 12 X, сочетает в себе элегантный дизайн и повышенную производительность.
- Обзор Dell Inspiron 14 Plus (7441): ноутбук начального уровня на Snapdragon X
- Instax Mini Link 3 против Link 2: что нового?
- Утечка новой Ryzen 7 9800X3D: «Эта легенда непобедима»
- Концовка «Субстанции» объясняет: что происходит со Сью и Элизабет?
- Любители кошек, обещаю, смотреть «Тихое место: день первый» безопасно.
- Обзор Beyerdynamic DT 770 Pro X Limited Edition – 100 лет звука
- Обзор Brother MFC-L3720CDW: надежный, но ограниченный цветной лазерный принтер
2024-06-28 21:27