Компания Google выпустила обновленную версию модели Gemini 2.5 Pro и заявила, что это «самая интеллектуальная модель на данный момент»

Похоже, что каждый день запускается новая версия искусственного интеллекта Google Gemini, и как обычно, компания представила значительное обновление своей модели высшего уровня 2.5 Pro. Новая версия нацелена на исправление проблем, возникших в предыдущем обновлении Gemini Pro, при этом ходят слухи о том, что это станет надежным релизом, доступным для всех пользователей через приложение Gemini.

Последнее обновление Gemini 2.5 Pro, известное как I/O Edition или версия 05-06, преимущественно акцентирует улучшения в области кодирования. По данным Google, последняя версия демонстрирует еще более высокий уровень производительности при генерации кода, достигнув впечатляющего результата в 82.2% на тесте Aidar Polyglot. Этот показатель значительно превосходит лучшие результаты от OpenAI, Anthropic и DeepSeek.

Стандартная модель Flash Gemini 2.5 теперь не в предварительной версии, но версия Pro еще не обновилась. На самом деле, последние обновления столкнулись с обоснованной критикой относительно производительности Pro вне задач кодирования после значительного обновления 25 марта. Логан Килпатрик из Google заявил, что команда признала эту обратную связь и утверждает, что предстоящая модель решит эти проблемы, начиная с обновления от 25 марта, сократив разрыв в качестве работы между версиями.

Килпатрик отмечает, что последняя версия 06-05 предлагает регулируемые когнитивные бюджеты для разработчиков, и команда ожидает, что это будет долгосрочным стабильным релизом. Это означает, что после развертывания версии Gemini 2.5 Pro как в пользовательских приложениях, так и на веб-интерфейсах в ближайшие недели, она больше не будет иметь метку ‘Preview’.

Google уделяет большое внимание качеству своих моделей и часто использует рейтинги с сайтов LM Arena и WebDevArena для получения обратной связи. Эти веб-сайты позволяют пользователям сравнивать результаты различных моделей параллельно, прежде чем анонимно их оценивать. Недавно был запущен модель Gemini 2.5, которая получила наивысший рейтинг среди крупных языковых моделей на LM Arena, что свидетельствует о предпочтении пользователями ее результатов перед другими.

Еще раз, Google заявляет о своем превосходстве, увеличив свой рейтинг Elo на 24 пункта в LMArena и опередив соперников на 35 пунктов в WebDevArena. Несмотря на то что Google уже занимал лидирующие позиции в обоих рейтингах, недавнее обновление Gemini Pro позволило ему еще больше укрепить свое преимущество.

В ходе наших тестов последняя модель дополнительно работает над тем, чтобы результаты сохраняли согласованное форматирование. Отдел искусственного интеллекта Google часто подчеркивает, что такие элементы, как заголовки, пункты списка и выделенный текст, оказывают значительное влияние на пользовательский опыт согласно их внутренним исследованиям.

Стоит отметить, что в наших тестах последняя модель Gemini 2.5 Pro дала окончательный и правильный ответ на один из давних вопросов. Когда ей задали вопрос: «Если бы города Магента не существовало, то назывался ли бы цвет по-прежнему ‘магентой’?», новая модель Gemini 2.5 Pro уверенно ответила «нет.»

Если вы хотите настроить грядущую версию Gemini Pro, возможно, с запросами о необычных цветах, это можно сделать прямо сейчас через Vertex AI и AI Studio. Кроме того, приложение Gemini (в бета-фазе) также будет доступно начиная сегодня.

Смотрите также

2025-06-05 22:54