Компания DeepSeek выпустила DeepSeek-V3.1, обновленную версию своей революционной модели ИИ, запущенной в декабре 2024 года, которая мгновенно вошла в десятку самых мощных моделей ИИ, доступных во всем мире.
Компания удивила мир, подробно рассказав о том, как она обучила модель, используя гораздо меньше вычислительных ресурсов по более низкой цене, чем конкурирующие модели. Последняя версия работает как гибридная модель ИИ, сочетая в себе более быструю недумающую модель, которой славился DeepSeek V3, и более медленную думающую модель, которой славился DeepSeek R1.
Последняя модель DeepSeek AI LLM доступна для бесплатной загрузки по адресу https://huggingface.co/deepseek-ai/DeepSeek-V3.1 под лицензией MIT с открытым исходным кодом https://huggingface.co/deepseek-ai/DeepSeek-V3.1/blob/main/LICENSE. Читателям, желающим поэкспериментировать с полной моделью 671B DeepSeek-V3.1, потребуется не менее 720 ГБ свободного места для хранения данных (или 170 ГБ для 1-битной квантованной версии). Для самой маленькой квантованной модели потребуется мощный графический процессор с памятью не менее 24 ГБ, как, например, этот графический процессор Nvidia 5090 с 32 ГБ памяти на Amazon.
Обновленная модель DeepSeek-V3.1 улучшает способность к кодированию по сравнению с предыдущими моделями компании - не думающей V3 и думающей R1, согласно результатам теста SWE-bench. В других бенчмарках ИИ в режиме мышления она также показала лучшие результаты, чем предыдущая модель R1, включая xbench-DeepSearch, SimpleQA, и FRAMES Бенчмарки ИИ.
ИИ V3.1 имеет 128K токенов, а цены на доступ к API будут упрощены после 5 сентября 2025 года, чтобы учесть его гибридную природу. Читатели могут бесплатно пообщаться с ИИ DeepSeek-V3.1.