Нова версія Grok вразила користувачів своїм інтелектом

Час читання: 2 хв.

В інтернеті обговорюють можливі бенчмарки нової мовної моделі Grok 4 від xAI, компанії Ілона Маска. Дані опублікував X-аккаунт @legit_api, який раніше вже викладав підтверджені витоки по інших ШІ-сервісах. Якщо інформація вірна, Grok 4 показує вражаючі результати, особливо в завданнях, де потрібні логіка і розуміння, а не просто пошук інформації в інтернеті.

Найбільший інтерес викликали оцінки Grok 4 в бенчмарку Humanity Last Exam (HLE) — це 2500 складних питань з фізики, математики, права та інших дисциплін, які не можна просто знайти в пошуковій системі. Згідно з витоком, Grok 4 впорався з ними в півтора рази краще, ніж нинішні лідери на кшталт ChatGPT o3 і Gemini 2.5 Pro. В інших тестах — з програмування, біології та математики — його переваги більш скромні, але стабільні.

У бенчмарках фігурують дві версії Grok 4: звичайна і окрема модифікація, заточена під програмування. Також вказані два режими тестування — Standard і TTC. Перший ближче до реального використання, а другий показує теоретичний максимум, який можна вичавити з моделі при необмежених ресурсах.

Модель Grok 4 була спочатку представлена в квітні під назвою Grok 3.5, а потім перейменована. Маск обіцяв випустити її відразу, але пізніше визнав, що вона вимагає доопрацювання. Минулого тижня він заявив, що реліз відбудеться «після 4 липня». Поки цього не сталося.

Welcome to Liberty Case

Welcome to Liberty Case

Welcome to Liberty Case

Forever

Recommended

1-Year

1-Month

Forever

Recommended

1-Year

1-Month

Welcome to Liberty Case

росіяни просунулися на Лиманському та Покровському напрямках – карти ISW

Ексінженер Microsoft попереджає: ШІ може створити біозброю і знищити міста

Стане простішою версією ChatGPT: Apple почала створення власного чатбота, — Bloomberg

На Львівщині відкрили новий завод із переробки риби

На фронті понад 150 боїв за добу: росіяни атакували на 13 напрямках, – Генштаб

На Львівщині відкрили новий завод із переробки риби

Недорогий позашляховик Chery виявився гібридом Land Rover Defender і Toyota Prado (фото)

В Україні масштабна тривога тривала понад 40 хвилин

Хмельниччина зазнала ворожої атаки, попередньо без жертв – ОВА

На Львівщині відкрили новий завод із переробки риби

Недорогий позашляховик Chery виявився гібридом Land Rover Defender і Toyota Prado (фото)

В Україні масштабна тривога тривала понад 40 хвилин

Хмельниччина зазнала ворожої атаки, попередньо без жертв – ОВА

Нова версія Grok вразила користувачів своїм інтелектом

Головне за день

Росія та Китай розпочали спільні навчання після заяв Трампа про ядерні субмарини

На Велику Британію насувається потужний шторм: скасовано рух поїздів, що відомо

Хмельниччина зазнала ворожої атаки, попередньо без жертв – ОВА

На Вінниччині по всіх культурах урожайність вища, ніж торік

В Україні масштабна тривога тривала понад 40 хвилин

Опитування

ТОП новини

Киянин погрожував охоронцю ЖК гранатою і пістолетом, його затримали – поліція

На фронті понад 150 боїв за добу: росіяни атакували на 13 напрямках, – Генштаб

Торгував забороненими напоями: на Київщині судитимуть власника “чорного” бізнесу, – деталі