Nvidia стремится произвести революцию в области подключения центров обработки данных, используя свет https://www.tomshardware.com/networking/nvidia-outlines-plans-for-using-light-for-communication-between-ai-gpus-by-2026-silicon-photonics-and-co-packaged-optics-may-become-mandatory-for-next-gen-ai-data-centers. В марте 2025 года компания представила коммутаторы Spectrum-X Photonics Ethernet и Quantum-X Photonics InfiniBand. Они предназначены для соединения крупных "фабрик искусственного интеллекта" в разных местах и поддержки миллионов графических процессоров при одновременном снижении энергопотребления и затрат. Основная цель - интегрировать оптические двигатели в микросхемы коммутаторов, тем самым отказавшись от ненужных электрических компонентов.
Масштабирование - главная проблема. Когда скорость достигает 800 гигабит в секунду и более, медные соединения между серверами и коммутаторами замедляют работу. Сигналы теряют силу, проходя через платы и разъемы. Это происходит до того, как сигнал достигает оптического модуля. Nvidia утверждает, что эта потеря составляет примерно 22 децибела на 200-гигабитных каналах. Это означает, что требуется больше энергии, а каждый порт потребляет около 30 ватт. Дополнительные компоненты также увеличивают риск сбоев.
Совместно упакованная оптика, или CPO, меняет эту схему. Благодаря размещению оптического двигателя рядом с микросхемой коммутатора, сигналы передаются в волокно почти сразу. Это снижает электрические потери примерно до четырех децибел и уменьшает потребление энергии на порт примерно до девяти ватт. Nvidia утверждает, что в более крупных масштабах такой подход позволяет добиться примерно в 3,5 раза более высокой энергоэффективности, более чем в 60 раз более высокого качества сигнала, в 10 раз большей отказоустойчивости, поскольку имеется меньше активных частей, и примерно на 30% более быстрой настройки, поскольку меньше нужно строить и обслуживать.
Что касается Ethernet, то Spectrum-X Photonics нацелен на большие многопользовательские сети. Nvidia утверждает, что он обеспечивает примерно в 1,6 раза большую пропускную способность на единицу площади, чем обычный Ethernet. Варианты включают 128 портов со скоростью 800 Гбит/с или 512 портов со скоростью 200 Гбит/с. В сумме это достигает 100 Тб/с. Более крупные системы могут иметь до 512 портов по 800 Гб/с или 2 048 портов по 200 Гб/с. Это дает в общей сложности 400 Тбит/с.
Для InfiniBand компания Quantum-X Photonics специализируется на соединениях 800 Гбит/с (гигабит в секунду) и использует жидкостное охлаждение - систему, в которой для отвода тепла используется жидкий теплоноситель. Его топовый коммутатор имеет 144 порта и может обрабатывать 115 Тбит/с данных. Система также включает в себя внутрисетевые вычисления, которые обрабатывают данные в самой сети, с производительностью 14,4 триллиона операций с плавающей запятой в секунду. В системе используется новейшая технология Nvidia SHARP (Scalable Hierarchical Aggregation and Reduction Protocol) для ускорения групповых задач в сети.
Nvidia утверждает, что это поколение в два раза быстрее и в пять раз более масштабируемо для сетей искусственного интеллекта, чем предыдущее. План по улучшению масштабируемости тесно связан с платформой COUPE компании TSMC и передовыми методами упаковки. На первом этапе скорость оптических двигателей в модулях OSFP достигнет 1,6 Тбит/с. На втором этапе будет использоваться оптика, упакованная в материнскую плату, способная работать со скоростью 6,4 Тбит/с. На третьем этапе планируется достичь скорости 12,8 Тбит/с внутри процессорных блоков, что позволит еще больше снизить задержки и энергопотребление. Nvidia планирует запустить коммутаторы Quantum-X на базе CPO в начале 2026 года и Spectrum-X Photonics позже в том же году, причем в обоих случаях будет использоваться жидкостное охлаждение.
Nvidia сотрудничает с такими компаниями, как TSMC, Coherent, Corning, Fabrinet, Foxconn, Lumentum, SENKO, SPIL, Sumitomo Electric, TFC и другими, чтобы охватить производство, оптику и сборку. Цель - убрать тысячи отдельных деталей из больших кластеров, ускорить настройку и сделать возможными сети с миллионом графических процессоров без чрезмерного потребления энергии.
Источник(и)
TomsHardware (на английском языке)