Sora от OpenAI не кажется тем переломным моментом, которым она должна была стать

Как технический энтузиаст с более чем двадцатилетним опытом работы за плечами, я должен признаться, что видел свою долю революционных разработок в области искусственного интеллекта. Однако выпуск Sora от OpenAI оставил у меня ощущение, будто я застрял в бесконечном подвешенном состоянии разработки, а не нахожусь в авангарде инноваций.

В течение почти года OpenAI намекала на запуск Sora и неоднократно откладывала его. Однако во вторник они официально представили полностью работоспособную версию своей новой модели генерации видео, предназначенную для публичного использования. Несмотря на первоначальное волнение, похоже, что ранние пользователи релиза не слишком в восторге от него, да и я тоже.

Представляем Sora, нашу модель преобразования текста в видео.

Сора может создавать видеоролики продолжительностью до минуты, демонстрирующие сложные настройки, динамичные движения камеры и различных персонажей, демонстрирующих яркие чувства.

Подсказка: «Красиво, снежно…

— OpenAI (@OpenAI) 15 февраля 2024 г.

Еще в феврале компания представила Sora, получившую широкую похвалу за ее высококачественную визуализацию видео, имитирующую реальную жизнь. Согласно анонсовому блогу OpenAI, «Sora способна создавать видеоролики продолжительностью до минуты, сохраняя при этом визуальное качество и придерживаясь инструкций пользователя». По сути, кажется, что Сора не просто отвечает на запрос пользователя в подсказке, но также принимает во внимание то, как эти элементы существуют в нашем физическом мире.

Рекомендуемые видео

OpenAI продолжает публиковать все больше безумных видеороликов о Соре

Это 100 % создано искусственным интеллектом

9 видео об изменении реальности

<р>1. Слон из листьев

— Линус Экенстам (@LinusEkenstam) 18 марта 2024 г.

В марте компания поделилась дополнительными кадрами, созданными Сорой, на которых изображен слон, сделанный из листьев, демонстрирующий впечатляющие способности модели. Однако разработка Sora столкнулась с рядом задержек, как признал главный директор по продуктам OpenAI Кевин Вейл во время Reddit AMA. Он объяснил эти задержки необходимостью совершенствования модели, обеспечения безопасности, имитации и других аспектов, а также масштабирования вычислительных ресурсов.

Пока OpenAI совершенствовала возможности Sora, другие компании воспользовались возможностью добиться значительных успехов. Решения искусственного интеллекта, такие как Adobe Firefly, Runway Gen 3 Alpha, Meta Movie Gen и Kling от Kuaishou Technology, в прошлом году приобрели известность в Интернете, демонстрируя видео превосходного качества и более высоких скоростей обработки, чем то, что OpenAI постоянно предполагала.

Во вторник OpenAI представила и предоставила готовую к использованию версию Sora своим подписчикам Plus с оплатой 20 долларов в месяц и Pro с оплатой 200 долларов в месяц. Однако на короткий период кажется, что этот выпуск был остановлен, поскольку OpenAI прекратила принимать регистрации новых учетных записей, не предоставив точных сроков. По словам технологического комментатора Эда Зитрона на Bluesky, этот внезапный шаг заставил многих усомниться в действиях OpenAI, поскольку предоставление общедоступного доступа к видеогенератору может потенциально истощить их ресурсы.

По словам влиятельного лица YouTube Маркеса Браунли, видео, снятые Сорой, не оправдали ожиданий тех, кто успешно прошел. В своем обзорном видео Браунли упомянул, что создание 20-секундного клипа с разрешением 1080p заняло несколько минут, и ему было трудно точно изобразить ноги и движения объекта. Ноги часто неловко меняли положение на протяжении всего клипа, как показано на видео ниже, где гимнастка быстро меняла руки, ноги и голову, кувыркаясь на мат, что иллюстрирует точку зрения Браунли.

вот видео гимнастики, созданное Сорой

— Питер Лабуза (@labuzamovies.bsky.social) 2024-12-11T17:35:23.989Z

Питер Лабуза, который поделился видео с гимнастикой на Bluesky, не стеснялся критиковать модель. Он выразил свое недовольство, сказав: «Извините, но если вы разработаете инструмент, который превращает текст в видео, и попросите его показать бегущую по полю кошку, а при получении исходного изображения она просто будет стоять на месте, тогда ваш инструмент не функционирует должным образом.

Крис Оффнер, пользователь Bluesky, выразил аналогичную точку зрения с оттенком сарказма, заявив, что «Sora, по сути, представляет собой физический движок, управляемый данными», и поделился невероятно причудливым видео, на котором лыжник, по-видимому, игнорирует почти все установленные физические законы.

The Verge также раскрутил модель, выразив разочарование по поводу ее продолжающейся неспособности исключить непривлекательные элементы, такие как дополнительные конечности или деформированные объекты.

«Sora — это физический движок, управляемый данными.»x.com/chrisoffner3…

— Крис Оффнер (@chrisoffner3d.bsky.social) 10.12.2024T12:42:53.674Z

Важно отметить, что не всем Сора сразу не понравился. Что касается пользователя Натана Шипли, он продемонстрировал функцию «ремикса» модели, которая позволяет пользователям синхронизировать сгенерированное видео с движениями объектов в предоставленном образце. В частности, он создал сцену, в которой голова журавля двигалась точно так же, как ножницы, которые он снимал, держа в руках.

Тест Sora Remix: Ножницы для крана

Детальный вид любознательного журавля, осматривающего безмятежную природу у тихого пруда. Голова журавля время от времени выглядывает из кадра.

— Натан Шипли (@CitizenPlain), 10 декабря 2024 г.

На данный момент у нас нет никакой информации о том, когда компания снова начнет принимать новые регистрации от заинтересованных пользователей Sora. Неясно, сможет ли OpenAI привлечь Голливуд своей текущей версией Sora, как это сделал Runway с Gen 3 и Lionsgate, используя свое последнее обновление, но время покажет.

Один факт остается неоспоримым: OpenAI, когда-то лидировавшая во время бума искусственного интеллекта, быстро отстает от других секторов отрасли. Вялый запуск продуктов, таких как недавний выпуск Sora, может только усугубить испорченный имидж компании.

Смотрите также

2024-12-12 23:58