В последние дни сектор искусственного интеллекта оживленно обсуждает новый термин: ‘AI с возможностями PhD’. Согласно сообщению The Information, OpenAI якобы вводит несколько AI-сервисов, специализирующихся на определенных областях. Один из этих сервисов стоимостью 20 тысяч долларов в месяц будет сосредоточен на поддержке исследований уровня PhD. Среди других потенциальных предложений — ассистент для высокооплачиваемых профессионалов за 2 тысячи долларов в месяц и инструмент разработки программного обеспечения за 10 тысяч долларов в месяц.
Важно отметить, что OpenAI пока не подтвердили эти детали цен, но они уже намекали на возможности искусственного интеллекта, эквивалентные уровню PhD. Таким образом, когда мы говорим о «AI с уровнем PhD», имеется в виду продвинутые модели, которые способны выполнять задачи, традиционно требующие степени доктора наук. Такие задачи могут включать проведение сложных исследований, автономное написание и отладка сложного кода, а также анализ огромных объемов данных для создания комплексных отчетов. Суть в том, что эти модели разработаны для решения проблем, которые обычно требуют многих лет специализированного академического обучения.
Компании такие как OpenAI устанавливают свои утверждения на уровне доктора философии путем демонстрации исключительной производительности в специализированных бенчмарки-тестированиях. Например, модели серии o1 от OpenAI считаются выдающимися в области науки, программирования и математики, показывая результаты, сопоставимые с кандидатами PhD при выполнении сложных задач. Кроме того, инструмент Deep Research от OpenAI, способный создавать исследовательские статьи с полным списком источников, набрал 26.6% на ‘Humanity’s Last Exam’, строгом экзамене, включающем более 3000 вопросов по более чем 100 различным предметам.
Недавний прогресс OpenAI в этой области базируется на их недавно представленных моделях o3 и o3-mini, объявленных в декабре. Эти модели расширяют семейство моделей o1, которое было представлено ранее в прошлом году. Как и модели o1, модели o3 используют то, что OpenAI называет «частной линией рассуждений», которая представляет собой симулированный метод внутреннего обсуждения и постепенного решения проблем перед предоставлением окончательного ответа.
Этот метод напоминает, как учёные тратят время на размышления над сложными вопросами, а не сразу предлагают решения. Как объясняет OpenAI, более значительное инвестирование времени на вычисление при выводе дает лучшие результаты. Проще говоря, при $20 000 вложений клиент фактически покупает обширное время для размышлений у AI модели, чтобы эффективно решать сложные проблемы.
OpenAI сообщает, что O3 достиг выдающегося результата на тесте визуального мышления ARC-AGI, получив балл 87.5% при использовании высокопроизводительных систем, производительность которого сравнима с человеческой, если учитывать порог в 85%. Кроме того, он набрал впечатляющий результат 96.7% на Международном математическом конкурсе США 2024 года, пропустив всего один вопрос, и получил балл 87.7% на тесте GPQA Diamond, содержащем сложные вопросы по биологии, физике и химии уровня магистратуры.
В бенчмарке по математике Frontier Math от EpochAI модель o3 решала 25,2% задач, в то время как ни одна из других моделей не справлялась с более чем 2%. Это свидетельствует о значительном прогрессе в возможностях решения математических задач по сравнению с предшествующими моделями.
Сравнение с реальной ценностью
С точки зрения технических специалистов я был бы рад представить высокоуровневую модель ИИ с эквивалентным PhD пониманием. Эта модель могла бы погружаться в обширные данные медицинских исследований, выявляя закономерности и открытия, которые могут ускользать от человеческих исследователей. Например, она могла бы анализировать огромные объемы данных о климате, помогая лучше понимать и прогнозировать глобальные погодные условия и изменения окружающей среды. Более того, такая ИИ могла бы взять на себя рутинные задачи исследовательской работы, освобождая время ученых для более творческих и сложных задач, что ускорит темп научных открытий и инноваций.
Согласно отчетам из The Information, если это правда, то ОпенайтИ считает, что их системы могут предложить значительную ценность компаниям, учитывая высокие цены. Наиболее заметно, что СофтБанк, инвестор в ОпенайтИ, обязался потратить ошеломляющие 3 миллиарда долларов на продукты агентов ОпенайтИ этого года, что свидетельствует о сильном бизнес-интересе несмотря на затраты.
В настоящее время OpenAI испытывает финансовые трудности из-за значительных потерь, что потенциально может повлиять на их ценовую структуру высшего уровня. За один только прошлый год компания сообщила об убытках примерно в 5 миллиардов долларов, учитывая операционные расходы и дополнительные траты, связанные с предоставлением услуг.
После нескольких лет предложения доступных AI-сервисов новости о дорогих планах ценообразования от OpenAI стали неожиданностью, учитывая что пользователи привыкли к мощным возможностям за сравнительно низкие цены. Хотя ChatGPT Plus продолжается по $20 в месяц и Claude Pro стоит $30 ежемесячно, эти суммы кажутся крошечными по сравнению с предлагаемыми корпоративными уровнями. Фактически даже подписка на ChatGPT Pro за $200/месяц бледнеет перед новыми планами ценообразования. Оправдаются ли различия в производительности между этими уровнями столь значительной разницей в цене, еще предстоит увидеть.
Хотя эти модели искусственного интеллекта преуспевают в стандартных тестах, они сталкиваются с проблемами конфабуляции — ситуациями, когда генерируют информацию, которая звучит убедительно, но на самом деле является неверной. Этот вопрос вызывает серьезные сомнения относительно их надежности при исследовательских задачах, где точность и надежность имеют решающее значение. Возникает вопрос: могут ли организации полагаться на такие системы, чтобы избежать незначительных ошибок в критически важных исследовательских проектах при ежемесячных инвестициях в 20 тысяч долларов?
В ответ на последние новости многие пользователи соцсетей шутили, что компаниям было бы выгоднее нанять настоящего студента PhD вместо этого. Хьеу Пхам, разработчик xAI, подчеркнул это в широко распространенном твите, сказав: «Важно помнить, что большинство студентов PhD, даже самые талантливые из тех, кто может превзойти любые текущие LLMs (модели языкового обучения), не зарабатывают 20 тысяч долларов в месяц.»
Наблюдая за этими системами, я вижу их превосходство в определенных задачах, однако называть их ‘PhD уровня’ больше похоже на маркетинговый ход, чем на точное описание. Эти модели могут быстро обрабатывать и генерировать информацию с удивительной скоростью, но остается вопрос об их способности подлинно эмулировать креативное мышление, интеллектуальное сомнение и оригинальное исследование, которые характеризуют настоящую докторскую работу. Однако им не требуется отдых или страховка здоровья, и вероятно, со временем они станут только более способными и экономически эффективными.
Смотрите также
- 7 лучших чехлов для Apple iPhone 16 Pro Max 2024 года
- Honor Magic 7 Pro против OnePlus 13: битва андроидов
- LG OLED55G4
- 20 лучших циферблатов Samsung Galaxy Watch, которые вам стоит использовать
- Разблокируйте DeepSeek: обойдите цензуру за 10 минут!
- Обзор Beyerdynamic DT 770 Pro X Limited Edition – 100 лет звука
- Huawei Watch GT 5 против GT 4: стоит ли обновлять свое носимое устройство?
- Моторола Мото G75 5G
- Несколько недель с Pocket 386, полуразрушенным ретро-ПК в стиле начала 90-х.
- Моторола Мото G35 5G
2025-03-08 04:25