
Инструмент с открытым исходным кодом измеряет уровень глупости моделей ИИ
Новый инструмент с открытым исходным кодом предлагает мониторинг в реальном времени нескольких моделей ИИ, включая OpenAI GPT-5, Claude Opus 4 и Gemini 2.5 Pro. Первый в своем роде, он может обнаружить, "когда компании, занимающиеся разработкой ИИ, сокращают возможности моделей в целях экономии средств" Бенчмарки могут также работать с собственными API-ключами OpenAI, xAI, Anthropic или Google.