Генерация изображений с помощью ИИ сделала огромный шаг вперед

Как человек, который с детства увлекался изображениями, созданными с помощью искусственного интеллекта, я должен сказать, что эти недавние обновления от Midjourney, Google и Grok действительно захватили у меня дух! Каждый из них демонстрирует быстрое развитие технологии и вызывает у меня трепет перед тем, что ждет впереди.


Некоторое время мы сосуществовали с изображениями, созданными искусственным интеллектом, но на этой неделе мы увидели некоторые заметные достижения от ключевых игроков отрасли. Примечательно, что были существенно обновлены недавно разработанная модель Midjourney и Grok.

С моей точки зрения интересно наблюдать, как каждая организация прокладывает свой уникальный курс технологического роста, со скоростями и траекториями, которые значительно различаются. Ландшафт остается ярким и динамичным, что является свидетельством успехов, которых мы коллективно добились. Каждый игрок демонстрирует свои достижения, давая представление о том, насколько далеко мы продвинулись в области инноваций.

Midjourney появился в сети

Генерация изображений с помощью ИИ сделала огромный шаг вперед

Начните с обсуждения недавнего релиза Midjourney, представленного в четверг без особой помпы и представляющего собой инновационный веб-редактор. Этот редактор объединяет различные основные инструменты редактирования изображений в простой в использовании интерфейс для удобства пользователей.

Раньше различные функции, такие как изменение кадра, перерисовка с использованием ресурсов, созданных искусственным интеллектом, панорамирование, расширение холста и масштабирование, были отдельными инструментами, разбросанными по разным меню. Это означало, что создателям приходилось часто переключаться между вариантами. Однако этот новый пользовательский интерфейс обеспечивает более унифицированный и оптимизированный процесс редактирования, который сильно отличается от первоначального запуска программы на Discord.

Midjourney только что выпустила свой веб-редактор!

На самом деле это одна из самых крутых функций, которые они выпустили за последнее время

По сути, позволяет выполнять рисование, панорамирование, масштабирование и многое другое за один шаг

действительно очень мощно

— Ник Сен-Пьер (@nickfloats), 16 августа 2024 г.

По словам генерального директора Midjourney Дэвида Хольца в своем недавнем сообщении на Discord, последний веб-редактор был разработан для более плавного и легкого редактирования изображений, созданных искусственным интеллектом. По сути, он заявил, что эта новая функция сделает редактирование изображений MJ более плавным, чем раньше, что означает значительный шаг вперед.

Несмотря на переход к веб-приложению, Midjourney по-прежнему будет синхронизировать сообщения из популярных каналов, таких как «daily-theme», «prompt-craft» и «general-1», между своими веб-комнатами и каналами Discord. Это позволяет пользователям участвовать в этих обсуждениях на предпочитаемой ими платформе. Кроме того, компания представила новый инструмент, который функционирует как цифровая кисть, заменяя инструменты выделения квадратом и лассо.

Пользователи Midjourney, создавшие более 10 изображений на платформе, теперь имеют доступ к совершенно новому редактору. До сих пор отзывы создателей преимущественно были положительными.

Через две недели после выпуска Midjourney 6.1 в редактор программного обеспечения было внесено обновление. В этой версии улучшена четкость изображения, согласованность (например, отображение нужного количества пальцев) и значительно сокращено время обработки. Кроме того, это повысило точность понимания текста в графических подсказках.

Грок-2 выпускает на волю монстра

Среди последних обновлений новости о Midjourney появились всего через два дня после запуска Grok-2 от проекта xAI Илона Маска – захватывающее событие, которое попало в заголовки новостей на этой неделе.

Способности Грока генерировать изображения обусловлены быстро набирающей популярность моделью Flux.1, разработанной Black Forest Lab, известной своим исключительным качеством изображения и тем фактом, что ее можно использовать бесплатно.

24 часа с момента запуска Grok 2.0 и его возможностей создания изображений!

Я тщательно подготовил эти девять образцов в надежде, что они окажутся вам полезными. Кроме того, я хотел бы предоставить доступ к моей обширной библиотеке подсказок, накопленной за годы личных исследований и роста.

(Добавьте это в закладки на будущее)

— TechHalla (@techhalla) 15 августа 2024 г.

Самое большое противоречие с Гроком-2 связано не только с его качеством, которое довольно хорошее, но и с его, казалось бы, неопределенными руководящими принципами. В отличие от многих других генераторов изображений ИИ, Grok-2, по-видимому, имеет очень мало рекомендаций в отношении интеллектуальной собственности, насилия и другого откровенного контента. Это не первый раз, когда генератор изображений ИИ сталкивается с такой ошибкой, но в случае с Гроком это кажется намеренным, а Маск назвал его «самым забавным ИИ в мире».

Предыдущие пользователи раздвинули границы и создали множество тревожных и необычных визуальных эффектов, напоминающих начальный этап создания изображений ИИ. Однако, если верить комментариям Маска, в Grok-2, похоже, намеренно отсутствуют какие-либо четкие рекомендации, которые потенциально могли бы повлиять на будущий путь развития этой технологии.

Google становится конкурентоспособным с Imagen 3

Генерация изображений с помощью ИИ сделала огромный шаг вперед

Недавно я заметил, что Google представила свою последнюю модель искусственного интеллекта Imagen 3, которая вчера стала доступна всем пользователям в США. Google хвастается ею как своей «моделью преобразования текста в изображение высшего уровня», способной генерировать «большую детализацию, более яркое освещение и меньше надоедливых артефактов по сравнению с нашими более ранними моделями». Google далее объясняет, что Imagen-3 умеет рендерить текст и поставляется в различных версиях, адаптированных для конкретных задач: от легкого быстрого эскиза до чего-то сложного и высокого разрешения.

В настоящее время вы можете получить доступ к Imagen 3 исключительно через AI Test Kitchen от Google в разделе ImageFX. Однако обратите внимание: поскольку игра находится на стадии закрытого бета-тестирования, участие ограничено, и вам, возможно, придется присоединиться к списку ожидания, если вы еще не зарегистрированы.

Смотрите также

2024-08-17 00:27