NVIDIA Vera Rubin NVL72 Подробно: 72 GPU, 36 CPU, пропускная способность масштабирования 260 ТБ/с.

NVIDIA объявляет об AI-платформе Rubin: 6-чиповая стопка, HBM4 и до 5-кратного увеличения производительности вывода по сравнению с Blackwell.

На выставке CES 2026 компания NVIDIA представила Rubin, свою новейшую AI-платформу для центров обработки данных. Эта новая система основана на шести инновационных чипах и будет доступна в конфигурациях, таких как стойка Vera Rubin NVL72 и серверная платформа HGX Rubin NVL8.

💰

"Рынок красный? Это просто сезон скидок для умных инвесторов." - так говорят, чтобы не плакать. У нас — аналитика, которая помогает плакать реже.

Найти недооцененные активы

Сердцем системы является графический процессор Rubin, содержащий массивные 336 миллиардов транзисторов и созданный с использованием двух производственных кристаллов. NVIDIA утверждает, что он может выполнять до 50 PFLOPs для инференса и 35 PFLOPs для обучения, что, по их словам, в 5 и 3.5 раза быстрее, чем Blackwell, соответственно. Графический процессор также переходит на память HBM4, предлагая до 288 ГБ на GPU и пропускную способность памяти до 22 терабайт в секунду.

Как исследователь, я изучаю архитектуру Rubin, которая работает в паре с новым процессором под названием Vera. Vera обладает 227 миллиардами транзисторов и использует собственные ядра Arm ‘Olympus’. Он оснащен 88 ядрами и 176 потоками, используя технологию пространственного многопотока NVIDIA. Мы видим до 1.5 ТБ памяти LPDDR5x (SOCAMM) и пропускную способность памяти, достигающую 1.2 ТБ/с. Важно отметить, что когерентная пропускная способность NVLink-C2C указана на уровне 1.8 ТБ/с, и NVIDIA утверждает, что эта комбинация обеспечивает двукратную производительность в таких областях, как обработка данных, сжатие и CI/CD по сравнению с их предыдущей архитектурой Grace.

Для увеличения вычислительной мощности NVLink 6 предлагает скорость передачи данных между графическими процессорами в 3,6 терабайт в секунду, и NVIDIA утверждает, что стойка графических процессоров NVL72 может достичь объединенной пропускной способности в 260 терабайт в секунду. Коммутатор NVLink 6 также действует как основная часть вычислительной сети, обеспечивая общую пропускную способность 28,8 терабайт в секунду и 14,4 терафлопс вычислительной мощности FP8 на единицу коммутатора. Для создания более крупных, распределенных систем NVIDIA выпускает ConnectX-9 и BlueField-4. ConnectX-9 может передавать до 1,6 терабит в секунду на графический процессор Rubin, а BlueField-4 — это Data Processing Unit (DPU) со скоростью 800 гигабит в секунду. Эти технологии работают с Spectrum-X Ethernet Photonics, которые подключены к Spectrum-6 и инфраструктуре коммутаторов, способной к 102,4 терабита в секунду, используя встроенные оптические компоненты.

Самая мощная рэковая конфигурация NVIDIA, Vera Rubin NVL72, объединяет 72 графических процессора Rubin с 36 центральными процессорами, все соединены высокоскоростной технологией NVLink 6. NVIDIA утверждает, что эта установка обеспечивает впечатляющую производительность: 3.6 EFLOPS для AI-вывода и 2.5 EFLOPS для обучения. Также она может похвастаться большим объемом памяти: 20.7 ТБ HBM4 и 54 ТБ LPDDR5x, с пропускной способностью памяти 1.6 ПБ/с. NVIDIA подчеркивает, что Rubin значительно снижает затраты на AI – до 10 раз ниже для вывода и требующий в четыре раза меньше графических процессоров для определенных задач обучения по сравнению с их системой Blackwell. Они также утверждают, что MoE-вывод стоит примерно в семь раз дешевле, чем использование GB200.

NVIDIA объявила, что её чип Rubin сейчас находится в производстве, раньше, чем предполагалось ранее – конец 2026 года. Хотя партнерам по-прежнему ожидается его наличие во второй половине 2026 года, NVIDIA планирует начать развертывание Rubin с основными облачными провайдерами – включая AWS, Google Cloud, Microsoft и Oracle Cloud – а также партнерами, такими как CoreWeave, Lambda, Nebius и Nscale, начиная с начала 2026 года.

NVIDIA Vera vs Grace CPUs
VideoCardz.com	Grace CPU	Vera CPU
Cores	72 ядра Neoverse V2	88 пользовательских ядер NVIDIA Olympus
Threads	72	176 Пространственное многопоточное выполнение
L2 Cache per core	1МБ	2МБ
Объединённый L3 кэш	114MB	162МБ
Пропускная способность памяти (BW)	До 512 ГБ/с	До 1.2 ТБ/с
Объём памяти	До 480 ГБ LPDDR5X	До 1.5 ТБ LPDDR5X
SIMD	4x 128b SVE2	6x 128b SVE2 FP8
NVLINK-C2C	900 ГБ/с	1.8TB/s
PCIe/CXL	Gen5	Gen6/CXL 3.1
Конфиденциальные вычисления	NA	Поддерживается

Смотрите также

2026-01-06 02:05