Новая модель искусственного интеллекта Meta может превращать текст в 3D-изображения менее чем за минуту

Новая модель искусственного интеллекта Meta может превращать текст в 3D-изображения менее чем за минуту

Как поклонник технологий и искусственного интеллекта, я в полном восторге от последнего анонса Meta своей новой модели 3D Gen. Эта система меняет правила игры в мире создания изображений, предлагая не только высококачественные 3D-изображения, но и возможность применять новые текстуры и скины с помощью простых текстовых подсказок.


Новейшее достижение Meta в области изображений, генерируемых искусственным интеллектом, заслуживает внимания. Во вторник технологический гигант представил свою инновационную модель «3D Gen». Эта передовая система быстро преобразует текстовый ввод в реалистичные трехмерные изображения примерно за одну минуту.

Кроме того, утверждается, что система может добавлять новые текстуры и скины как к самостоятельно созданным, так и к созданным вручную визуальным эффектам с помощью текстовых инструкций.

Недавно я наткнулся на интересное исследование, проведенное исследовательской группой Meta Gen AI. Согласно их выводам, 3D Gen будет предоставлять не только подробные текстуры, но и карты материалов. Кроме того, он будет включать физический рендеринг (PBR) и возможности генеративного ретекстурирования.

Недавнее исследование, представленное исследователями GenAI из Meta: Представляем Meta 3D Gen — новую систему, способную создавать 3D-ресурсы непосредственно из текста за 60 секунд.

Meta 3D Gen представляет собой передовое решение искусственного интеллекта, способное создавать 3D-модели высшего уровня. Эта система не только генерирует подробные текстуры, но и создает карты материалов за один рабочий процесс.

— AI в Meta (@AIatMeta), 2 июля 2024 г.

Команда подсчитала, что создание первичной 3D-модели с помощью Meta AssetGen занимает примерно 30 секунд. Позже пользователи могут либо улучшить текущую текстуру, либо заменить ее новой с помощью TextureGen, что, по мнению Meta, потребует всего лишь дополнительных 20 секунд для времени вывода.

В аннотации исследования команда объяснила, что 3DGen представляет 3D-объекты в трех измерениях с помощью уникальной комбинации методов: изображения их в пространстве, где они просматриваются, определения их формы и объема в отдельном объемном пространстве и отображения деталей их текстуры в УФ (или текстурное) пространство. Команда Meta оценила свою модель 3D Gen по нескольким отраслевым критериям, оценивая такие факторы, как точность текстовых подсказок, визуальная четкость, сложность текстур и наличие артефактов. Объединив возможности обеих моделей, аннотаторы в 68% случаев отдали предпочтение изображениям, полученным с помощью двухэтапного процесса, по сравнению с изображениями, созданными с использованием одноэтапного подхода.

Как технический энтузиаст, я в восторге от потенциальных последствий системы, описанной в этой статье, несмотря на то, что она находится на начальной стадии и еще не доступна широкой публике. Революционные технологические достижения, продемонстрированные в этом исследовании, способны произвести революцию в различных творческих областях, включая спецэффекты в играх и фильмах, а также приложения виртуальной реальности.

Предоставление пользователям возможности не только создавать, но и изменять 3D-контент эффективным и удобным способом значительно снижает препятствия для работы в этой области. Потенциальные последствия для разработки игр огромны.

Смотрите также

2024-07-02 23:57