NVIDIA объявляет об AI-платформе Rubin: 6-чиповая стопка, HBM4 и до 5-кратного увеличения производительности вывода по сравнению с Blackwell.

На выставке CES 2026 компания NVIDIA представила Rubin, свою новейшую AI-платформу для центров обработки данных. Эта новая система основана на шести инновационных чипах и будет доступна в конфигурациях, таких как стойка Vera Rubin NVL72 и серверная платформа HGX Rubin NVL8.
"Рынок красный? Это просто сезон скидок для умных инвесторов." - так говорят, чтобы не плакать. У нас — аналитика, которая помогает плакать реже.
Найти недооцененные активыСердцем системы является графический процессор Rubin, содержащий массивные 336 миллиардов транзисторов и созданный с использованием двух производственных кристаллов. NVIDIA утверждает, что он может выполнять до 50 PFLOPs для инференса и 35 PFLOPs для обучения, что, по их словам, в 5 и 3.5 раза быстрее, чем Blackwell, соответственно. Графический процессор также переходит на память HBM4, предлагая до 288 ГБ на GPU и пропускную способность памяти до 22 терабайт в секунду.

Как исследователь, я изучаю архитектуру Rubin, которая работает в паре с новым процессором под названием Vera. Vera обладает 227 миллиардами транзисторов и использует собственные ядра Arm ‘Olympus’. Он оснащен 88 ядрами и 176 потоками, используя технологию пространственного многопотока NVIDIA. Мы видим до 1.5 ТБ памяти LPDDR5x (SOCAMM) и пропускную способность памяти, достигающую 1.2 ТБ/с. Важно отметить, что когерентная пропускная способность NVLink-C2C указана на уровне 1.8 ТБ/с, и NVIDIA утверждает, что эта комбинация обеспечивает двукратную производительность в таких областях, как обработка данных, сжатие и CI/CD по сравнению с их предыдущей архитектурой Grace.


Для увеличения вычислительной мощности NVLink 6 предлагает скорость передачи данных между графическими процессорами в 3,6 терабайт в секунду, и NVIDIA утверждает, что стойка графических процессоров NVL72 может достичь объединенной пропускной способности в 260 терабайт в секунду. Коммутатор NVLink 6 также действует как основная часть вычислительной сети, обеспечивая общую пропускную способность 28,8 терабайт в секунду и 14,4 терафлопс вычислительной мощности FP8 на единицу коммутатора. Для создания более крупных, распределенных систем NVIDIA выпускает ConnectX-9 и BlueField-4. ConnectX-9 может передавать до 1,6 терабит в секунду на графический процессор Rubin, а BlueField-4 — это Data Processing Unit (DPU) со скоростью 800 гигабит в секунду. Эти технологии работают с Spectrum-X Ethernet Photonics, которые подключены к Spectrum-6 и инфраструктуре коммутаторов, способной к 102,4 терабита в секунду, используя встроенные оптические компоненты.

Самая мощная рэковая конфигурация NVIDIA, Vera Rubin NVL72, объединяет 72 графических процессора Rubin с 36 центральными процессорами, все соединены высокоскоростной технологией NVLink 6. NVIDIA утверждает, что эта установка обеспечивает впечатляющую производительность: 3.6 EFLOPS для AI-вывода и 2.5 EFLOPS для обучения. Также она может похвастаться большим объемом памяти: 20.7 ТБ HBM4 и 54 ТБ LPDDR5x, с пропускной способностью памяти 1.6 ПБ/с. NVIDIA подчеркивает, что Rubin значительно снижает затраты на AI – до 10 раз ниже для вывода и требующий в четыре раза меньше графических процессоров для определенных задач обучения по сравнению с их системой Blackwell. Они также утверждают, что MoE-вывод стоит примерно в семь раз дешевле, чем использование GB200.
NVIDIA объявила, что её чип Rubin сейчас находится в производстве, раньше, чем предполагалось ранее – конец 2026 года. Хотя партнерам по-прежнему ожидается его наличие во второй половине 2026 года, NVIDIA планирует начать развертывание Rubin с основными облачными провайдерами – включая AWS, Google Cloud, Microsoft и Oracle Cloud – а также партнерами, такими как CoreWeave, Lambda, Nebius и Nscale, начиная с начала 2026 года.
| NVIDIA Vera vs Grace CPUs | ||
|---|---|---|
| VideoCardz.com | Grace CPU | Vera CPU |
| Cores | 72 ядра Neoverse V2 | 88 пользовательских ядер NVIDIA Olympus |
| Threads | 72 | 176 Пространственное многопоточное выполнение |
| L2 Cache per core | 1МБ | 2МБ |
| Объединённый L3 кэш | 114MB | 162МБ |
| Пропускная способность памяти (BW) | До 512 ГБ/с | До 1.2 ТБ/с |
| Объём памяти | До 480 ГБ LPDDR5X | До 1.5 ТБ LPDDR5X |
| SIMD | 4x 128b SVE2 | 6x 128b SVE2 FP8 |
| NVLINK-C2C | 900 ГБ/с | 1.8TB/s |
| PCIe/CXL | Gen5 | Gen6/CXL 3.1 |
| Конфиденциальные вычисления | NA | Поддерживается |
Смотрите также
- NVIDIA хочет, чтобы геймеры выбирали подходящий пресет модели DLSS 4.5 для своей RTX GPU.
- OP криптовалюта и прогнозы цен на OP
- Обзор RingConn Gen 2: умное кольцо, экономящее деньги
- Все фильмы ужасов, выходящие в 2026 году.
- Обзор Pimax Crystal Light: новый стандарт доступного ПК VR
- Обзор Fujifilm X-E5
- 20 лучших циферблатов Samsung Galaxy Watch, которые вам стоит использовать
- 6 лучших планшетов для путешествий в 2024 году
- Очень странные дела 5 подтверждают, почему Векна похищает детей в 4-й серии (и причина жуткая)
- Я рассмотрел пару крошечных наушников, которые помогли мне лучше спать
2026-01-06 02:05