Ілон Маск та новий прорив у світі штучного інтелекту: Grok 4.20 прагне до лідерства у бенчмарках

Chas Pravdy - 11 Серпня 2025 08:35

У світі високих технологій та штучного інтелекту активно триває боротьба за лідерські позиції, і одним із головних гравців на цьому полі є Ілон Маск зі своєю компанією xAI.

Найновішою новиною стало оголошення про майбутній реліз оновленої версії Grok 4.20, яка за запевненнями засновника компанії вже до кінця серпня має посісти перше місце у популярному бенчмарку SimpleBench, обійшовши попередників і затьмаривши конкуренцію.Маск у своєму твітері опублікував повідомлення, що саме ця версія має шанс досягти вершини.

Водночас, докладний аналіз результатів показує, що модель Grok 4 уже випереджає новий GPT-5 та змагається лише з Gemini 2.5 Pro, що демонструє високий рівень конкурентоспроможності.

Інтерес викликає той факт, що компанія xAI працює з меншим, ніж у гігантів галузі, кадровим складом — усього близько 30%, що свідчить про ефективність та швидкість інновацій.Крім результатів у SimpleBench, Grok 4 демонструє помітні переваги й у інших тестах — ARC-AGI та ARC-AGI-2.

Зокрема, у першому випадку модель показала 68% результату проти 65% GPT-5, а у другому — 16% проти 9,9%.

Не менш цікаво, що Grok 4 Heavy трохи випереджає GPT-5 Pro у тесті Humanity’s Last Exam — 44,4% проти 42%.

Маск підкреслив, що компанія постійно оновлює та вдосконалює ці моделі, зокрема, Grok 4 Heavy, для підвищення їхньої продуктивності).На сьогодні не зовсім зрозуміло, що саме має на увазі Маск під версією Grok 4.20, проте, за планами xAI, у 2025 році очікується запуск нових спеціалізованих версій — Grok 4 Coder, яка орієнтована на програмістів, Grok 4 V2 із покращеними мультимодальними можливостями та Baby Grok — штучний інтелект для малят.

Не виключено, що незабаром побачимо і нові релізи для генерації зображень та відео.

Особливо цікаво, що вже запланований вихід Grok 5 вже до кінця 2025 року.Реакція громадськості і фахівців на платформах соціальних мережах, зокрема на X, свідчить про приголомшливий інтерес і схвалення швидких темпів розвитку Grok.

Однак у світі штучного інтелекту також є і змагання.

Так, найсвіжішим прикладом є поєдинок у шахах, де модель o3 від OpenAI, всупереч перевагам Grok 4 у попередніх матчах, зазнала поразки у фіналі через серію грубих помилок.

Це показує, що навіть у високотехнологічному світі успіх і лідерство вимагають не лише потужних можливостей, а й безперервної боротьби та вдосконалення.

Джерело