В последние дни сектор искусственного интеллекта оживленно обсуждает новый термин: ‘AI с возможностями PhD’. Согласно сообщению The Information, OpenAI якобы вводит несколько AI-сервисов, специализирующихся на определенных областях. Один из этих сервисов стоимостью 20 тысяч долларов в месяц будет сосредоточен на поддержке исследований уровня PhD. Среди других потенциальных предложений — ассистент для высокооплачиваемых профессионалов за 2 тысячи долларов в месяц и инструмент разработки программного обеспечения за 10 тысяч долларов в месяц.
"Рынок красный? Это просто сезон скидок для умных инвесторов." - так говорят, чтобы не плакать. У нас — аналитика, которая помогает плакать реже.
Найти недооцененные активыВажно отметить, что OpenAI пока не подтвердили эти детали цен, но они уже намекали на возможности искусственного интеллекта, эквивалентные уровню PhD. Таким образом, когда мы говорим о «AI с уровнем PhD», имеется в виду продвинутые модели, которые способны выполнять задачи, традиционно требующие степени доктора наук. Такие задачи могут включать проведение сложных исследований, автономное написание и отладка сложного кода, а также анализ огромных объемов данных для создания комплексных отчетов. Суть в том, что эти модели разработаны для решения проблем, которые обычно требуют многих лет специализированного академического обучения.
Компании такие как OpenAI устанавливают свои утверждения на уровне доктора философии путем демонстрации исключительной производительности в специализированных бенчмарки-тестированиях. Например, модели серии o1 от OpenAI считаются выдающимися в области науки, программирования и математики, показывая результаты, сопоставимые с кандидатами PhD при выполнении сложных задач. Кроме того, инструмент Deep Research от OpenAI, способный создавать исследовательские статьи с полным списком источников, набрал 26.6% на ‘Humanity’s Last Exam’, строгом экзамене, включающем более 3000 вопросов по более чем 100 различным предметам.
Недавний прогресс OpenAI в этой области базируется на их недавно представленных моделях o3 и o3-mini, объявленных в декабре. Эти модели расширяют семейство моделей o1, которое было представлено ранее в прошлом году. Как и модели o1, модели o3 используют то, что OpenAI называет «частной линией рассуждений», которая представляет собой симулированный метод внутреннего обсуждения и постепенного решения проблем перед предоставлением окончательного ответа.
Этот метод напоминает, как учёные тратят время на размышления над сложными вопросами, а не сразу предлагают решения. Как объясняет OpenAI, более значительное инвестирование времени на вычисление при выводе дает лучшие результаты. Проще говоря, при $20 000 вложений клиент фактически покупает обширное время для размышлений у AI модели, чтобы эффективно решать сложные проблемы.
OpenAI сообщает, что O3 достиг выдающегося результата на тесте визуального мышления ARC-AGI, получив балл 87.5% при использовании высокопроизводительных систем, производительность которого сравнима с человеческой, если учитывать порог в 85%. Кроме того, он набрал впечатляющий результат 96.7% на Международном математическом конкурсе США 2024 года, пропустив всего один вопрос, и получил балл 87.7% на тесте GPQA Diamond, содержащем сложные вопросы по биологии, физике и химии уровня магистратуры.
В бенчмарке по математике Frontier Math от EpochAI модель o3 решала 25,2% задач, в то время как ни одна из других моделей не справлялась с более чем 2%. Это свидетельствует о значительном прогрессе в возможностях решения математических задач по сравнению с предшествующими моделями.
Сравнение с реальной ценностью
С точки зрения технических специалистов я был бы рад представить высокоуровневую модель ИИ с эквивалентным PhD пониманием. Эта модель могла бы погружаться в обширные данные медицинских исследований, выявляя закономерности и открытия, которые могут ускользать от человеческих исследователей. Например, она могла бы анализировать огромные объемы данных о климате, помогая лучше понимать и прогнозировать глобальные погодные условия и изменения окружающей среды. Более того, такая ИИ могла бы взять на себя рутинные задачи исследовательской работы, освобождая время ученых для более творческих и сложных задач, что ускорит темп научных открытий и инноваций.
Согласно отчетам из The Information, если это правда, то ОпенайтИ считает, что их системы могут предложить значительную ценность компаниям, учитывая высокие цены. Наиболее заметно, что СофтБанк, инвестор в ОпенайтИ, обязался потратить ошеломляющие 3 миллиарда долларов на продукты агентов ОпенайтИ этого года, что свидетельствует о сильном бизнес-интересе несмотря на затраты.
В настоящее время OpenAI испытывает финансовые трудности из-за значительных потерь, что потенциально может повлиять на их ценовую структуру высшего уровня. За один только прошлый год компания сообщила об убытках примерно в 5 миллиардов долларов, учитывая операционные расходы и дополнительные траты, связанные с предоставлением услуг.
После нескольких лет предложения доступных AI-сервисов новости о дорогих планах ценообразования от OpenAI стали неожиданностью, учитывая что пользователи привыкли к мощным возможностям за сравнительно низкие цены. Хотя ChatGPT Plus продолжается по $20 в месяц и Claude Pro стоит $30 ежемесячно, эти суммы кажутся крошечными по сравнению с предлагаемыми корпоративными уровнями. Фактически даже подписка на ChatGPT Pro за $200/месяц бледнеет перед новыми планами ценообразования. Оправдаются ли различия в производительности между этими уровнями столь значительной разницей в цене, еще предстоит увидеть.
Хотя эти модели искусственного интеллекта преуспевают в стандартных тестах, они сталкиваются с проблемами конфабуляции — ситуациями, когда генерируют информацию, которая звучит убедительно, но на самом деле является неверной. Этот вопрос вызывает серьезные сомнения относительно их надежности при исследовательских задачах, где точность и надежность имеют решающее значение. Возникает вопрос: могут ли организации полагаться на такие системы, чтобы избежать незначительных ошибок в критически важных исследовательских проектах при ежемесячных инвестициях в 20 тысяч долларов?
В ответ на последние новости многие пользователи соцсетей шутили, что компаниям было бы выгоднее нанять настоящего студента PhD вместо этого. Хьеу Пхам, разработчик xAI, подчеркнул это в широко распространенном твите, сказав: «Важно помнить, что большинство студентов PhD, даже самые талантливые из тех, кто может превзойти любые текущие LLMs (модели языкового обучения), не зарабатывают 20 тысяч долларов в месяц.»
Наблюдая за этими системами, я вижу их превосходство в определенных задачах, однако называть их ‘PhD уровня’ больше похоже на маркетинговый ход, чем на точное описание. Эти модели могут быстро обрабатывать и генерировать информацию с удивительной скоростью, но остается вопрос об их способности подлинно эмулировать креативное мышление, интеллектуальное сомнение и оригинальное исследование, которые характеризуют настоящую докторскую работу. Однако им не требуется отдых или страховка здоровья, и вероятно, со временем они станут только более способными и экономически эффективными.
Смотрите также
- 7 лучших чехлов для Apple iPhone 16 Pro Max 2024 года
- Разблокируйте DeepSeek: обойдите цензуру за 10 минут!
- 20 лучших циферблатов Samsung Galaxy Watch, которые вам стоит использовать
- Xiaomi 14T Pro против Samsung Galaxy S24: что купить?
- Обзор Honor 400
- Samsung Galaxy S25 против Xiaomi 15: как сравниваются Android-смартфоны?
- Обзор саундбара LG S95TR: наконец-то хорошо
- TCL 50 Pro Nxtpaper 5G
- Обзор Poco F7
- Обзор настоящих беспроводных наушников Audio-Technica ATH-CKS30TW+
2025-03-08 04:25