Google наносит ответный удар по запуску OpenAI Sora

Как опытный наблюдатель с многолетним опытом работы в технологической отрасли, я должен признать, что быстрый прогресс в области создания видео и изображений с помощью искусственного интеллекта просто поразителен. Подразделение Google DeepMind еще раз доказало свою стойкость, представив Veo 2, модель, которая расширяет границы того, что мы считали возможным при создании виртуального видео.

💰

"Рынок красный? Это просто сезон скидок для умных инвесторов." - так говорят, чтобы не плакать. У нас — аналитика, которая помогает плакать реже.

Найти недооцененные активы

В понедельник подразделение Google DeepMind представило модель генерации видео второго поколения Veo, способную создавать видеоролики продолжительностью до двух минут и с разрешением до 4K. Это означает, что она в шесть раз длиннее и в четыре раза четче, чем Sora, чей максимальный выходной сигнал составляет 20 секунд при разрешении 1080p.

Действительно, мы здесь обсуждаем максимальный потенциал Veo 2. В настоящее время его можно найти только на VideoFX, испытательном полигоне Google для создания видео. Продолжительность создаваемых видеороликов ограничена восемью секундами и имеет разрешение 720p. Стоит отметить, что VideoFX в настоящее время пользуется большим спросом, а это означает, что доступ пока открыт не для всех, но Google планирует расширить доступ в ближайшем будущем. Кроме того, представитель Google упомянул, что как только они смогут расширить возможности Veo 2, он также станет доступен и на Vertex AI.

Рекомендуемые видео

Проще говоря, Эли Коллинз поделился с TechCrunch, что в ближайшие месяцы они внесут улучшения на основе отзывов пользователей. Они также планируют включить расширенные функции Veo 2 в различные интересные сценарии на платформе Google. Ожидайте дальнейших обновлений об этих событиях в следующем году.

Ух ты, только что узнал, что Google представила модели нового поколения для создания видео и изображений — Veo 2 и Imagen 3! С нетерпением жду возможности изучить эти достижения в области цифровых медиатехнологий!

Оказывается, Google незаметно сокращает разрыв — не только в программах LLM, но и в визуальном создании.

Вот все, что вам нужно знать, без всякой шумихи

— Билавал Сидху (@bilawalsidhu) 16 декабря 2024 г.

Говорят, что версия 2 превосходит свои более ранние модели по ряду преимуществ. Например, он может похвастаться более точным пониманием принципов физики, что приводит к улучшенной динамике жидкости и превосходным эффектам освещения/затенения. Более того, он обеспечивает более четкое видео, поскольку сгенерированные текстуры и изображения более четкие и с меньшей вероятностью будут размыты во время движения. Наконец, эта последняя версия предоставляет пользователям обновленную систему управления камерой, позволяющую более точно размещать объектив виртуальной камеры по сравнению с более ранними моделями.

По данным TechCrunch, Veo 2 все еще нуждается в улучшении процесса создания видео, поскольку в настоящее время он генерирует меньше галлюцинаций по сравнению с конкурентами, такими как Sora, Kling, Movie Gen или Gen 3 Alpha. Тем не менее, Коллинз отметил, что существует потенциал для улучшения в поддержании связности и последовательности, поскольку, хотя Veo может следовать простым подсказкам в течение нескольких минут, ему трудно выполнять сложные инструкции в течение длительных периодов времени и постоянно поддерживать согласованность символов. Кроме того, есть возможности для улучшения создания сложных деталей, быстрых и сложных действий и расширения границ реализма.

В понедельник Google представил улучшения для Imagen 3, благодаря которым инструмент создания бизнес-изображений дает «более четкие и эстетичные» результаты. Этот инструмент, доступный через ImageFX, теперь будет предоставлять дополнительные описательные рекомендации на основе ключевых слов, введенных пользователем, при этом каждое ключевое слово запускает раскрывающийся список релевантных терминов для дальнейшего уточнения.

Смотрите также

2024-12-16 22:27