Amazon представляет новое семейство базовых моделей Nova

Amazon представляет новое семейство базовых моделей Nova

Как опытный наблюдатель, внимательно следящий за технологическими достижениями, я должен признать, что презентация Amazon Nova оставила меня весьма заинтригованным и несколько благоговейным. Став свидетелем эволюции искусственного интеллекта за последние несколько десятилетий, интересно видеть, как далеко мы продвинулись со времен простых систем преобразования текста в речь.


На конференции Amazon re:Invent, состоявшейся во вторник, генеральный директор Amazon Энди Ясси представил шесть инновационных моделей создания текста, изображений и видео, которые они назвали Amazon Nova.

Это новое семейство мультимодальных генеративных ИИ включает Nova Micro, текстовую модель, созданную для недорогих ответов с малой задержкой; Nova Lite, недорогая мультимодальная модель для обработки входных изображений, видео и текста; и Nova Pro, мультимодальная модель общего назначения, которая сочетает в себе «точность, скорость и стоимость для широкого круга задач», согласно сообщению компании. Nova Premier — это «наиболее мощные… мультимодальные модели Amazon для решения сложных логических задач», Nova Canvas — это специальный механизм преобразования текста в изображение, а Nova Reel специально создан для создания видео.

Рекомендуемые видео

Текстовые модели были точно настроены для 15 различных языков. Micro предлагает контекстное окно объемом 128 000 символов, а Lite и Pro могут обрабатывать до 300 000 символов (приблизительно 225 000 слов или около 30 минут видеоконтента). Компания планирует расширить контекстные окна своих более крупных моделей до 2 миллионов символов к началу следующего года.

С помощью Canvas пользователи могут легко создавать и изменять изображения, просто используя команды на естественном языке. В будущем Reels – конкурент Gen-3 Alpha, Kling и Dall-E 3 – будет генерировать короткие видеоролики (до шести секунд) не только из текстовых подсказок, но и из эталонных изображений. Этот инструмент для создания видео даже включает в себя функции управления движением камеры, такие как панорамирование и масштабирование.

Ясси рассказал, что мы самостоятельно развиваем наши модели расширения границ. За последние несколько месяцев эти инновационные модели претерпели значительные улучшения. Думая аналогичным образом, мы полагали, что, если мы найдем в них ценность, вы тоже сможете обнаружить ценность» (перефразировано из вашего первоначального заявления).

Как аналитик, я могу выразить это так: я отметил, что эти конкретные модели не только экономичны в использовании, но и являются одними из самых быстрых в своей категории, хотя Amazon не предоставил конкретных контрольных данных, подтверждающих эти утверждения. еще. Их отличает оптимизация для использования с нашими собственными системами и API, что упрощает процесс выполнения множества организованных автоматизированных задач. На мой взгляд, это делает их весьма привлекательными вариантами.

Все варианты, включая Micro, Lite, Pro, Canvas и Reels, теперь доступны для пользователей Amazon Web Services (AWS). Предложение Premiere будет развернуто к первому кварталу 2025 года.

Смотрите также

2024-12-04 21:57