NVIDIA Vera Rubin NVL72 Подробно: 72 GPU, 36 CPU, пропускная способность масштабирования 260 ТБ/с.

NVIDIA объявляет об AI-платформе Rubin: 6-чиповая стопка, HBM4 и до 5-кратного увеличения производительности вывода по сравнению с Blackwell.

На выставке CES 2026 компания NVIDIA представила Rubin, свою новейшую AI-платформу для центров обработки данных. Эта новая система основана на шести инновационных чипах и будет доступна в конфигурациях, таких как стойка Vera Rubin NVL72 и серверная платформа HGX Rubin NVL8.

💰

"Рынок красный? Это просто сезон скидок для умных инвесторов." - так говорят, чтобы не плакать. У нас — аналитика, которая помогает плакать реже.

Найти недооцененные активы

Сердцем системы является графический процессор Rubin, содержащий массивные 336 миллиардов транзисторов и созданный с использованием двух производственных кристаллов. NVIDIA утверждает, что он может выполнять до 50 PFLOPs для инференса и 35 PFLOPs для обучения, что, по их словам, в 5 и 3.5 раза быстрее, чем Blackwell, соответственно. Графический процессор также переходит на память HBM4, предлагая до 288 ГБ на GPU и пропускную способность памяти до 22 терабайт в секунду.

Как исследователь, я изучаю архитектуру Rubin, которая работает в паре с новым процессором под названием Vera. Vera обладает 227 миллиардами транзисторов и использует собственные ядра Arm ‘Olympus’. Он оснащен 88 ядрами и 176 потоками, используя технологию пространственного многопотока NVIDIA. Мы видим до 1.5 ТБ памяти LPDDR5x (SOCAMM) и пропускную способность памяти, достигающую 1.2 ТБ/с. Важно отметить, что когерентная пропускная способность NVLink-C2C указана на уровне 1.8 ТБ/с, и NVIDIA утверждает, что эта комбинация обеспечивает двукратную производительность в таких областях, как обработка данных, сжатие и CI/CD по сравнению с их предыдущей архитектурой Grace.

Для увеличения вычислительной мощности NVLink 6 предлагает скорость передачи данных между графическими процессорами в 3,6 терабайт в секунду, и NVIDIA утверждает, что стойка графических процессоров NVL72 может достичь объединенной пропускной способности в 260 терабайт в секунду. Коммутатор NVLink 6 также действует как основная часть вычислительной сети, обеспечивая общую пропускную способность 28,8 терабайт в секунду и 14,4 терафлопс вычислительной мощности FP8 на единицу коммутатора. Для создания более крупных, распределенных систем NVIDIA выпускает ConnectX-9 и BlueField-4. ConnectX-9 может передавать до 1,6 терабит в секунду на графический процессор Rubin, а BlueField-4 — это Data Processing Unit (DPU) со скоростью 800 гигабит в секунду. Эти технологии работают с Spectrum-X Ethernet Photonics, которые подключены к Spectrum-6 и инфраструктуре коммутаторов, способной к 102,4 терабита в секунду, используя встроенные оптические компоненты.

Самая мощная рэковая конфигурация NVIDIA, Vera Rubin NVL72, объединяет 72 графических процессора Rubin с 36 центральными процессорами, все соединены высокоскоростной технологией NVLink 6. NVIDIA утверждает, что эта установка обеспечивает впечатляющую производительность: 3.6 EFLOPS для AI-вывода и 2.5 EFLOPS для обучения. Также она может похвастаться большим объемом памяти: 20.7 ТБ HBM4 и 54 ТБ LPDDR5x, с пропускной способностью памяти 1.6 ПБ/с. NVIDIA подчеркивает, что Rubin значительно снижает затраты на AI – до 10 раз ниже для вывода и требующий в четыре раза меньше графических процессоров для определенных задач обучения по сравнению с их системой Blackwell. Они также утверждают, что MoE-вывод стоит примерно в семь раз дешевле, чем использование GB200.

NVIDIA объявила, что её чип Rubin сейчас находится в производстве, раньше, чем предполагалось ранее – конец 2026 года. Хотя партнерам по-прежнему ожидается его наличие во второй половине 2026 года, NVIDIA планирует начать развертывание Rubin с основными облачными провайдерами – включая AWS, Google Cloud, Microsoft и Oracle Cloud – а также партнерами, такими как CoreWeave, Lambda, Nebius и Nscale, начиная с начала 2026 года.

NVIDIA Vera vs Grace CPUs
VideoCardz.com Grace CPU Vera CPU
Cores 72 ядра Neoverse V2 88 пользовательских ядер NVIDIA Olympus
Threads 72 176 Пространственное многопоточное выполнение
L2 Cache per core 1МБ 2МБ
Объединённый L3 кэш 114MB 162МБ
Пропускная способность памяти (BW) До 512 ГБ/с До 1.2 ТБ/с
Объём памяти До 480 ГБ LPDDR5X До 1.5 ТБ LPDDR5X
SIMD 4x 128b SVE2 6x 128b SVE2 FP8
NVLINK-C2C 900 ГБ/с 1.8TB/s
PCIe/CXL Gen5 Gen6/CXL 3.1
Конфиденциальные вычисления NA Поддерживается

Смотрите также

2026-01-06 02:05