Notebookcheck Logo

Grok 4 побеждает ChatGPT и становится лучшей публичной моделью ИИ, а Элон Маск рассказывает о премиум-подписке за $300/мес

Логотип языковой модели ИИ Grok 4. (Источник изображения: xAI)
Логотип языковой модели ИИ Grok 4. (Источник изображения: xAI)
Новый Grok 4 от компании Элона Маска xAI стал лучшей моделью ИИ, доступной публике, по мнению сторонних платформ тестирования, опередив ChatGPT или Gemini от Google. Команда xAI также представила новую и дорогую подписку на ИИ под названием Grok 4 Heavy.

Спустя чуть более двух лет после выпуска Grok от xAI стал ведущей языковой моделью ИИ, опередив ChatGPT от OpenAI, Gemini от Google или DeepSeek, а также Meta и Anthropic. Grok появится в автомобилях Tesla на следующей неделе, сообщил Элон Маск.

По данным независимого стороннего тестирования, недавно выпущенный Grok 4 возглавил общедоступный чарт производительности моделей ИИ. Движущей силой 10-кратного улучшения рассуждений между Grok 3 и Grok 4 стали вычислительные кластеры ИИ, которые команда xAI создавала с бешеной скоростью, удвоив их до 200 000 GPU на пути к запланированному миллиону.

Команда xAI связалась с теми, кто проводит требовательные тесты производительности ARC-AGI, и попросила их провести свои наборы тестов ИИ, получив удивительные результаты:

Сначала факты: Grok 4 теперь является самой высокопроизводительной общедоступной моделью в ARC-AGI. Она даже превосходит специально созданные решения, представленные на Kaggle. Во-вторых, ARC-AGI-2 является сложным для современных моделей ИИ. Чтобы получить высокий балл, модели должны научиться мини-навыку на серии обучающих примеров, а затем продемонстрировать этот навык во время тестирования. Предыдущий высший балл был ~8% (у Opus 4). Ниже 10% - это шумно. Получив 15,9%, Grok 4 преодолевает этот шумовой барьер и демонстрирует ненулевой уровень жидкого интеллекта

Другой независимый тестер искусственного интеллекта, компания Artificial Analysis, заявила, что они

"провели полный набор бенчмарков, и Grok 4 получил индекс интеллекта Artificial Analysis 73, опередив OpenAI o3 на 70, Google Gemini 2.5 Pro на 70, Anthropic Claude 4 Opus на 64 и DeepSeek R1 0528 на 68"

По словам Элона Маска на презентации релиза Grok 4, модель xAI теперь умнее всех аспирантов по всем дисциплинам вместе взятых. С типичным для него блеском в глазах генеральный директор Tesla заявил, что Grok 4 сможет открывать "новые технологии", такие как лекарства или инженерные прорывы, уже в следующем году.

Тем не менее, он признал, что в течение ближайшего месяца или около того Grok все еще будет плохо распознавать изображения, и обратился к недавнему спору об ответах супремасистов https://www.bbc.com/news/articles/c4g8r34nxeno сказав, что"когда Grok идет далеко не так, это обычно связано с тем, что мы сделали какую-то глупость, например, плохой системный запрос или слишком большое значение придается необъективным источникам"

Маску необходимо прокачать Grok 4, поскольку его xAI впервые вводит платный премиум-уровень. Он называется SuperGrok Heavy и стоит $300 в месяц. В него входит то, что входит в уровень SuperGrok за $30 в месяц, который дает начальный доступ к Grok 4, плюс доступ к платформе Grok 4 Heavy, которая предлагает более высокие тарифные лимиты и ранний доступ к новым функциям.

Grok 3 останется бесплатным для широкой публики, в то время как каждый подписчик X Premium+ получит доступ к Grok 4 в рамках уровня SuperGrok.

График исторической производительности моделей Grok vs ChatGPT vs Gemini AI.
График исторической производительности моделей Grok vs ChatGPT vs Gemini AI.
Рейтинг лучших моделей ИИ.
Рейтинг лучших моделей ИИ.

Источник(и)

Этот важный материал точно понравится твоим друзьям в социальных сетях!
Mail Logo
'
> Обзоры Ноутбуков, Смартфонов, Планшетов. Тесты и Новости > Новости > Архив новостей > Архив новостей за 2025 год, 07 месяц > Grok 4 побеждает ChatGPT и становится лучшей публичной моделью ИИ, а Элон Маск рассказывает о премиум-подписке за $300/мес
Daniel Zlatev, 2025-07-10 (Update: 2025-07-10)