
Как исследователь с опытом работы в области искусственного интеллекта и машинного обучения, я считаю, что последняя разработка OpenAI, CriticGPT, является интригующим решением распространенной проблемы совершенствования моделей ИИ. Непрерывный процесс улучшения языковых моделей, таких как GPT-4, посредством обучения с подкреплением на основе обратной связи с человеком (RLHF), необходим для достижения более высокой производительности и точности. Однако по мере развития возможностей системы она может опережать инструкторов-людей, что затрудняет выявление ошибок и ошибок.
"Рынок красный? Это просто сезон скидок для умных инвесторов." - так говорят, чтобы не плакать. У нас — аналитика, которая помогает плакать реже.
Найти недооцененные активыOpenAI создала ИИ под названием CriticGPT, специально разработанный для сотрудничества с тренерами OpenAI в улучшении модели GPT-4. Его уникальная способность заключается в выявлении сложных ошибок кодирования, которые люди потенциально могут не заметить.
После первоначального обучения продвинутая языковая модель, такая как GPT-4, проходит фазу постоянного улучшения с использованием метода под названием «Обучение с подкреплением на основе обратной связи с человеком» (RLHF). На этом этапе инструкторы-люди взаимодействуют с системой и отмечают соответствующие ответы на различные запросы, а также оценивают различные ответы относительно друг друга. Эта обратная связь позволяет модели узнать, какой ответ является предпочтительным, и повышает общую точность ответа.
По мере того, как система становится более опытной, она может превзойти уровень знаний своего инструктора, что затрудняет выявление ошибок и неточностей.
Преподаватели искусственного интеллекта из OpenAI в прошлом году не обязательно были специалистами по конкретным предметам. Однако выяснилось, что они прибегли к передаче этой задачи кенийским работникам за минимальную оплату, около 1,60 доллара в час, чтобы повысить эффективность своих моделей.

Проблема возникает, в частности, при расширении возможностей системы по генерации кода, и именно здесь CriticGPT оказывается полезным.
Как аналитик, я разработал модель CriticGPT, основанную на GPT-4, для выявления ошибок в выводе кода, генерируемого ChatGPT. Согласно нашим недавним данным, когда пользователи получают помощь от CriticGPT при просмотре кода ChatGPT, им удается превзойти тех, кто работает в одиночку, примерно в 60% случаев.
Кроме того, корпорация представила исследовательскую работу по этой теме под названием «Критики LLM превосходят людей в обнаружении ошибок LLM». Результаты показали, что LLM выявляют значительно больше ошибок в кодировании, чем квалифицированные люди, выполняющие оценку кода, а также показали, что критика модели предпочтительнее критики человека в более чем 80% случаев.
Интересно отметить, что в этом исследовании частота галлюцинативных реакций у CriticGPT снизилась при сотрудничестве с людьми. Однако оно оставалось больше, чем когда задачу выполнял только человек самостоятельно.
Смотрите также
- Я думал, что этот Android-телефон за 250 долларов станет катастрофой. Это не было
- Обзор KTC M27P6 27-дюймового 4K Mini-LED: Производительность и соотношение цены и качества, с которыми трудно соперничать.
- Всё, что мы знаем о 24 сезоне NCIS.
- 20 лучших циферблатов Samsung Galaxy Watch, которые вам стоит использовать
- Разблокируйте DeepSeek: обойдите цензуру за 10 минут!
- OnePlus 15 против Oppo Find X9 Pro: Флагманы в сравнении
- 6 лучших планшетов для путешествий в 2024 году
- Onyx Boox Palma — самый крутой гаджет, который я использовал в 2024 году.
- Я носил часы, которые производились 50 лет. Вот почему это так особенно
- Onyx Boox Palma 2 — гаджет, о котором я даже не подозревал
2024-06-28 21:27