Компания OpenAI объявила о выпуске gpt-oss-120b и gpt-oss-20b, двух моделей с открытым исходным кодом, которые можно бесплатно загрузить и запустить локально в Вашей системе. Это первый релиз компании с открытым исходным кодом после выпуска GPT-2 в 2019 году.
Gpt-oss-120b - это модель с 117 миллиардами параметров, для запуска которой требуется внушительные 80 ГБ VRAM. Меньшая модель gpt-oss-20b - модель с 21 миллиардом параметров - может уместиться на одном GPU с 16 ГБ VRAM. Обе модели доступны под гибкой лицензией Apache 2.0.
OpenAI заявляет, что "этот релиз - значимый шаг в их приверженности экосистеме с открытым исходным кодом, что соответствует их заявленной миссии - сделать преимущества ИИ широко доступными" Компания хочет, чтобы они служили недорогим инструментом для разработчиков, исследователей и компаний, который можно было бы эффективно использовать и настраивать.
Как они работают?
Модель gpt-oss-120b набрала 2622 балла в тесте на кодирование Codeforces с инструментами, показав почти одинаковый результат с моделями компании o3 и o4-mini, и значительно опередила o3-mini в обоих тестах, набрав 2643 балла без инструментов.
Модель gpt-oss-20b набрала 2516 баллов с инструментами, показав результат на уровне с o3 и o4-mini, и 2230 без инструментов, с небольшим отрывом от o3-mini. OpenAI утверждает, что 120b справляется с запросами, связанными со здоровьем, и математикой даже лучше, чем o4-mini, а 20b превосходит o3-mini.
OpenAI утверждает, что модели 120b и 20b склонны к галлюцинациям гораздо больше, чем модели рассуждений, такие как o3 и o4-mini. В ходе тестов они обнаружили, что обе модели с открытым весом галлюцинируют в 49%-53% случаев в их собственных контрольных тестах, проверяющих модели на знание людей.
Обе модели можно загрузить с официального сайта Hugging Face и они поставляются квантованными в MXFP4 для повышения эффективности. Они также могут быть свободно развернуты на таких платформах, как Microsoft Azure, Hugging Face, vLLM, Ollama и llama.cpp, LM Studio, AWS, Fireworks, Together AI, и многое другое.
OpenAI ожидает, что эти модели "снизят барьеры для развивающихся рынков, секторов с ограниченными ресурсами и небольших организаций, которым может не хватить бюджета или гибкости для внедрения проприетарных моделей"
Что касается того, почему они выложили в открытый доступ новую модель спустя шесть лет после предыдущей, компания говорит, что хочет "сделать ИИ широко доступным и полезным для всех"