Google випустила Gemini 3.1 Pro з рекордним результатом

Нова модель штучного інтелекту від Google показала 77,1% у бенчмарку ARC-AGI-2, перевищивши середній людський результат і продемонструвавши рекордні показники в науці, програмуванні та мультимовних задачах.

0
16

Google представила Gemini 3.1 Pro: модель перевершила людський результат у тесті ARC-AGI-2

Компанія Google оголосила про запуск нової моделі штучного інтелекту Gemini 3.1 Pro, яка, за даними компанії, продемонструвала результати вище за середній людський рівень у тесті ARC-AGI-2.

Результати тестування

Під час проходження незалежного бенчмарку ARC-AGI-2, який оцінює здатність моделей до узагальнення та логічного мислення, Gemini 3.1 Pro набрала 77,1%.

Для порівняння, середній людський результат у цьому тесті становить близько 60%.

У компанії заявляють, що нова версія:

  • перевершила попередні покоління Gemini;

  • показала кращі результати за конкурентні моделі, зокрема GPT-5.2;

  • встановила рекордні показники в задачах із науки, програмування та мультиязикового аналізу.

Де доступна модель

Gemini 3.1 Pro наразі доступна у форматі прев’ю через:

  • Gemini API;

  • Google AI Studio;

  • Vertex AI;

  • підписки Google AI Pro та Google AI Ultra.

Розробники можуть інтегрувати модель у власні продукти через корпоративні та хмарні сервіси Google.

Контекст

Гонка у сфері генеративного штучного інтелекту між провідними технологічними компаніями продовжує загострюватися. Бенчмарки на кшталт ARC-AGI-2 використовуються для оцінки рівня абстрактного мислення моделей та їх здатності вирішувати нові завдання без попереднього навчання на конкретних прикладах.

Експерти зазначають, що хоча результати тестів є важливими, вони не завжди відображають повну картину практичної ефективності ШІ в реальних умовах.

Залишити відповідь