Как опытный наблюдатель с многолетним опытом работы в технологической отрасли, я должен признать, что быстрый прогресс в области создания видео и изображений с помощью искусственного интеллекта просто поразителен. Подразделение Google DeepMind еще раз доказало свою стойкость, представив Veo 2, модель, которая расширяет границы того, что мы считали возможным при создании виртуального видео.
В понедельник подразделение Google DeepMind представило модель генерации видео второго поколения Veo, способную создавать видеоролики продолжительностью до двух минут и с разрешением до 4K. Это означает, что она в шесть раз длиннее и в четыре раза четче, чем Sora, чей максимальный выходной сигнал составляет 20 секунд при разрешении 1080p.
Действительно, мы здесь обсуждаем максимальный потенциал Veo 2. В настоящее время его можно найти только на VideoFX, испытательном полигоне Google для создания видео. Продолжительность создаваемых видеороликов ограничена восемью секундами и имеет разрешение 720p. Стоит отметить, что VideoFX в настоящее время пользуется большим спросом, а это означает, что доступ пока открыт не для всех, но Google планирует расширить доступ в ближайшем будущем. Кроме того, представитель Google упомянул, что как только они смогут расширить возможности Veo 2, он также станет доступен и на Vertex AI.
Рекомендуемые видео
Проще говоря, Эли Коллинз поделился с TechCrunch, что в ближайшие месяцы они внесут улучшения на основе отзывов пользователей. Они также планируют включить расширенные функции Veo 2 в различные интересные сценарии на платформе Google. Ожидайте дальнейших обновлений об этих событиях в следующем году.
Ух ты, только что узнал, что Google представила модели нового поколения для создания видео и изображений — Veo 2 и Imagen 3! С нетерпением жду возможности изучить эти достижения в области цифровых медиатехнологий!
Оказывается, Google незаметно сокращает разрыв — не только в программах LLM, но и в визуальном создании.
Вот все, что вам нужно знать, без всякой шумихи
— Билавал Сидху (@bilawalsidhu) 16 декабря 2024 г.
Говорят, что версия 2 превосходит свои более ранние модели по ряду преимуществ. Например, он может похвастаться более точным пониманием принципов физики, что приводит к улучшенной динамике жидкости и превосходным эффектам освещения/затенения. Более того, он обеспечивает более четкое видео, поскольку сгенерированные текстуры и изображения более четкие и с меньшей вероятностью будут размыты во время движения. Наконец, эта последняя версия предоставляет пользователям обновленную систему управления камерой, позволяющую более точно размещать объектив виртуальной камеры по сравнению с более ранними моделями.
По данным TechCrunch, Veo 2 все еще нуждается в улучшении процесса создания видео, поскольку в настоящее время он генерирует меньше галлюцинаций по сравнению с конкурентами, такими как Sora, Kling, Movie Gen или Gen 3 Alpha. Тем не менее, Коллинз отметил, что существует потенциал для улучшения в поддержании связности и последовательности, поскольку, хотя Veo может следовать простым подсказкам в течение нескольких минут, ему трудно выполнять сложные инструкции в течение длительных периодов времени и постоянно поддерживать согласованность символов. Кроме того, есть возможности для улучшения создания сложных деталей, быстрых и сложных действий и расширения границ реализма.
В понедельник Google представил улучшения для Imagen 3, благодаря которым инструмент создания бизнес-изображений дает «более четкие и эстетичные» результаты. Этот инструмент, доступный через ImageFX, теперь будет предоставлять дополнительные описательные рекомендации на основе ключевых слов, введенных пользователем, при этом каждое ключевое слово запускает раскрывающийся список релевантных терминов для дальнейшего уточнения.
Смотрите также
- 7 лучших чехлов для Apple iPhone 16 Pro Max 2024 года
- Лучшие недорогие принтеры на 2024 год
- 20 лучших циферблатов Samsung Galaxy Watch, которые вам стоит использовать
- Обзор MobLand (сериал — 2025) — Похоже, у нас развивается ситуация.
- Honor Magic 7 Pro против OnePlus 13: битва андроидов
- Разблокируйте DeepSeek: обойдите цензуру за 10 минут!
- Наконец-то я нашел утилиту для игрового ноутбука, которую действительно стоит использовать
- AirPods Max 2 против AirPods Max: в чем разница?
- Моторола Мото G75 5G
- macOS 15 Sequoia заставляет вас преодолевать больше препятствий, чтобы отключить проверки приложения Gatekeeper
2024-12-16 22:27