Google представила Gemini 3.1 Pro: модель перевершила людський результат у тесті ARC-AGI-2
Компанія Google оголосила про запуск нової моделі штучного інтелекту Gemini 3.1 Pro, яка, за даними компанії, продемонструвала результати вище за середній людський рівень у тесті ARC-AGI-2.
Результати тестування
Під час проходження незалежного бенчмарку ARC-AGI-2, який оцінює здатність моделей до узагальнення та логічного мислення, Gemini 3.1 Pro набрала 77,1%.
Для порівняння, середній людський результат у цьому тесті становить близько 60%.
У компанії заявляють, що нова версія:
перевершила попередні покоління Gemini;
показала кращі результати за конкурентні моделі, зокрема GPT-5.2;
встановила рекордні показники в задачах із науки, програмування та мультиязикового аналізу.
Де доступна модель
Gemini 3.1 Pro наразі доступна у форматі прев’ю через:
Gemini API;
Google AI Studio;
Vertex AI;
підписки Google AI Pro та Google AI Ultra.
Розробники можуть інтегрувати модель у власні продукти через корпоративні та хмарні сервіси Google.
Контекст
Гонка у сфері генеративного штучного інтелекту між провідними технологічними компаніями продовжує загострюватися. Бенчмарки на кшталт ARC-AGI-2 використовуються для оцінки рівня абстрактного мислення моделей та їх здатності вирішувати нові завдання без попереднього навчання на конкретних прикладах.
Експерти зазначають, що хоча результати тестів є важливими, вони не завжди відображають повну картину практичної ефективності ШІ в реальних умовах.







