Компания DeepSeek представила последнюю версию своей революционной модели большого языка R1 AI, DeepSeek-R1-0528. Компания ворвалась в мир ИИ, выпустив свои модели V3 и R1, обе с производительностью в десятке лучших ИИ но при этом обучались дешевле, затрачивая меньше времени, чем конкурирующие модели от таких компаний, как OpenAI и Google.
Последняя модель R1 была протестирована на следующих эталонах ИИ:
- Американский пригласительный экзамен по математике (AIME) 2024
- Американский пригласительный экзамен по математике (AIME) 2025 г
- Google-Proof Q&A (GPQA)
- LiveCodeBench
- Кодирование с помощью искусственного интеллекта
- Последний экзамен человечества
Хотя производительность DeepSeek-R1-0528 выросла по сравнению с оригинальной версией R1 во всех бенчмарках, он правильно отвечает только на 17% вопросов в сложном тесте Humanity's Last Exam. Поскольку его ведущие конкуренты также плохо справляются с этим экзаменом, прирост в последней версии DeepSeek R1, скорее всего, связан с дополнительным временем обучения и настройки ИИ, а не с каким-либо прорывом в создании ИИ. Важно отметить, что в последней версии R1 уменьшилось количество галлюцинаций ИИ, поэтому он с меньшей вероятностью будет генерировать вводящие в заблуждение или ложные ответы.
Читатели, которые хотят поработать с моделью R1 с открытым исходным кодом, могут запустить дистиллированные версии с восемью миллиардами параметров, используя графический процессор Nvidia 4090 с 24 ГБ памяти.