Спустя чуть более двух лет после выпуска Grok от xAI стал ведущей языковой моделью ИИ, опередив ChatGPT от OpenAI, Gemini от Google или DeepSeek, а также Meta и Anthropic. Grok появится в автомобилях Tesla на следующей неделе, сообщил Элон Маск.
По данным независимого стороннего тестирования, недавно выпущенный Grok 4 возглавил общедоступный чарт производительности моделей ИИ. Движущей силой 10-кратного улучшения рассуждений между Grok 3 и Grok 4 стали вычислительные кластеры ИИ, которые команда xAI создавала с бешеной скоростью, удвоив их до 200 000 GPU на пути к запланированному миллиону.
Команда xAI связалась с теми, кто проводит требовательные тесты производительности ARC-AGI, и попросила их провести свои наборы тестов ИИ, получив удивительные результаты:
Сначала факты: Grok 4 теперь является самой высокопроизводительной общедоступной моделью в ARC-AGI. Она даже превосходит специально созданные решения, представленные на Kaggle. Во-вторых, ARC-AGI-2 является сложным для современных моделей ИИ. Чтобы получить высокий балл, модели должны научиться мини-навыку на серии обучающих примеров, а затем продемонстрировать этот навык во время тестирования. Предыдущий высший балл был ~8% (у Opus 4). Ниже 10% - это шумно. Получив 15,9%, Grok 4 преодолевает этот шумовой барьер и демонстрирует ненулевой уровень жидкого интеллекта
Другой независимый тестер искусственного интеллекта, компания Artificial Analysis, заявила, что они
"провели полный набор бенчмарков, и Grok 4 получил индекс интеллекта Artificial Analysis 73, опередив OpenAI o3 на 70, Google Gemini 2.5 Pro на 70, Anthropic Claude 4 Opus на 64 и DeepSeek R1 0528 на 68"
По словам Элона Маска на презентации релиза Grok 4, модель xAI теперь умнее всех аспирантов по всем дисциплинам вместе взятых. С типичным для него блеском в глазах генеральный директор Tesla заявил, что Grok 4 сможет открывать "новые технологии", такие как лекарства или инженерные прорывы, уже в следующем году.
Тем не менее, он признал, что в течение ближайшего месяца или около того Grok все еще будет плохо распознавать изображения, и обратился к недавнему спору об ответах супремасистов https://www.bbc.com/news/articles/c4g8r34nxeno сказав, что"когда Grok идет далеко не так, это обычно связано с тем, что мы сделали какую-то глупость, например, плохой системный запрос или слишком большое значение придается необъективным источникам"
Маску необходимо прокачать Grok 4, поскольку его xAI впервые вводит платный премиум-уровень. Он называется SuperGrok Heavy и стоит $300 в месяц. В него входит то, что входит в уровень SuperGrok за $30 в месяц, который дает начальный доступ к Grok 4, плюс доступ к платформе Grok 4 Heavy, которая предлагает более высокие тарифные лимиты и ранний доступ к новым функциям.
Grok 3 останется бесплатным для широкой публики, в то время как каждый подписчик X Premium+ получит доступ к Grok 4 в рамках уровня SuperGrok.