Компания Nvidia анонсировала вычислительную архитектуру Rubin AI следующего поколения, которая, наконец, будет соответствовать китайской стратегии ИИ, позволяя выполнять выводы ИИ при гораздо меньших затратах, чем нынешняя редакция Blackwell.
Как и Nvidia Rubin AI, платформа построена на шести вычислительных подсистемах, работающих вместе: CPU Vera, новый GPU Nvidia Rubin, коммутатор NVLink 6 третьего поколения, сетевая карта ConnectX-9 SuperNIC, DPU BlueField-4 и Ethernet-коммутатор Spectrum-6. Чипы построены на передовых литейных узлах TSMC, в них реализованы оптимизации интерфейса, направленные на резкое снижение стоимости токенов и продолжительности обучения.
Фактически, "кодовый дизайн" Nvidia в шести новых чипах позволяет обучать модели с помощью четверти GPU, необходимых в текущей платформе Nvidia Blackwell, и снижает стоимость одного токена в десять раз. Десятикратное снижение стоимости токенов - это то, что Элон Маск обещает для следующего поколения Tesla AI5 компьютер следующего поколения AI5 компании Tesla; просто его массовое производство начнется не раньше следующего года. Элон Маск назвал Nvidia Rubin "ракетным двигателем для ИИ", который позволит внедрять краевые модели в масштабе.
Китай также гордится тем, что низкой Ценой токенов ИИ, которой он добился благодаря открытому доступу к таким моделям, как DeepSeek и объединения в цепочку множества графических процессоров ИИ среднего уровня, таких как Huawei 910C таким образом, архитектура Nvidia Rubin наконец-то делает что-то для решения проблемы не только производительности, но и стоимости запуска моделей ИИ.
Возможно, самой интересной частью платформы Rubin является новый процессор Nvidia Vera,"разработанный для перемещения данных и агентских рассуждений в ускоренных системах, с полной поддержкой конфиденциальных вычислений" Он может работать в паре с графическим процессором Nvidia или как отдельный процессор, выполняя"аналитические, облачные, оркестровые, хранилищные и высокопроизводительные вычисления (HPC) рабочие нагрузки" с полной совместимостью с Arm.
Технические характеристики процессора Vera включают 88 пользовательских ядер и 1,2 ТБ/с пропускной способности памяти LPDDR5X, а также очень экономное потребление энергии. Интеграция интерфейса связи NVLink-C2C обеспечивает синхронизированный доступ к памяти CPU-GPU как часть функций оптимизации, которые делают платформу Rubin на порядок более эффективной, чем ее предшественник на базе Blackwell.
Приобретите персональный ИИ-суперкомпьютер Nvidia DGX Spark на Amazon






