Сталкиваясь с нормативными препятствиями и экспортными ограничениями, компании, занимающиеся разработкой искусственного интеллекта в Китае, все чаще используют отремонтированные https://www.digitimes.com/news/a20250827PD214/nvidia-h100-hardware-china-demand.html и бывшие в употреблении ускорители Nvidia. Когда экспорт H20 возобновился в июле, новые китайские правила безопасности данных усложнили закупку ограниченного количества карт Hopper от Nvidia. В результате покупатели обратились к старым платам A100 и H100, и теперь производители восстанавливают и продают эти платы для создания доступных высокопроизводительных кластеров для вычислений.
Выводы требуют меньше вычислений, чем обучение, и не нуждаются в полной точности вычислений с плавающей запятой. Плата A100 2020 года предлагает до 80 гигабайт HBM2e и около 2 ТБ/с пропускной способности. Он по-прежнему хорошо справляется с чат-ботами и рекомендательными движками. Зрелое программное обеспечение CUDA от Nvidia помогает, учитывая уровень развития стека. Для команд, сосредоточенных на обслуживании моделей, а не на их обучении, более старый кремний - разумное вложение средств.
Для сравнения, модель H100 повышает производительность, предлагая HBM3 и гораздо более высокую пропускную способность. H20 соответствует правилам экспорта, но его производительность ИИ примерно в три-семь раз ниже, чем у полноценного H100, и более чем в тридцать раз ниже при двойной точности. Учитывая эти ограничения, многие покупатели в Китае по-прежнему предпочитают использовать переработанные карты H100, а не новые модули H20.
Системы вычислений могут работать непрерывно с минимальным риском для точности, а старые платы, совместимые с CUDA, легко устанавливаются. Восстановленные карты по-прежнему пользуются большим спросом, несмотря на некоторые сомнения в надежности. Центры обработки данных могут расширяться немедленно, а не ждать одобренных деталей.
Между тем, компания Nvidia находится в сложной ситуации: изменения в правилах лицензирования в США привели к списанию 5,5 миллиардов долларов от непроданных запасов H20. В то же время, нехватка официальных карт означает, что старые графические процессоры Nvidia продолжают подпитывать рост ИИ в Китае за счет неофициальных и восстановленных продаж. Такая динамика может повлиять на прибыль Nvidia и затянуть процесс внедрения новых технологий.
Что касается внутреннего фронта, то китайское правительство поощряет отечественные ускорители, такие как Huawei и Birenно каждый подержанный H100 или тюнингованный A100, установленный в китайских дата-центрах, сокращает рынок систем на базе Ascend и замедляет инвестиции в отечественные стеки.
Вместе взятые, эти правила создают экономику переработки. Контроль, ограничивающий передовые вычисления, и политика поощрения местных чипов позволяют старым аппаратным средствам Nvidia служить дольше.
Источник(и)
DigiTimes (на английском языке)