Яндекс 23 мая открыл публичный бета-доступ к Yandex GPT 5 Pro. Это первое крупное обновление флагманской линейки с осени 2025 года и часть более широкой ставки компании на B2B-инфраструктуру для генеративного ИИ. Регистрация на бету — через личный кабинет в Yandex Cloud, доступ открывается в течение суток после заполнения анкеты.

Компания заявляет об улучшении качества на 22% по внутреннему бенчмарку, оценивающему задачи логического рассуждения на русском языке. Методология бенчмарка пока не опубликована — Яндекс ссылается на готовящийся технический отчёт, который выйдет одновременно с переходом модели в общую доступность.

Что вошло в обновление

Релиз включает три направления изменений. Первое — переработанная токенизация для русского языка. По данным компании, средняя длина токена увеличена на 18%, что снижает стоимость обработки русскоязычного текста в эквивалентном долларовом выражении и уменьшает потери смысла на длинных входах.

Второе — расширение поддержки tool use. API теперь принимает спецификацию функций в формате, совместимом с OpenAI Function Calling, что упрощает миграцию интеграций. Поддерживается параллельный вызов нескольких функций в одном ответе модели — это ключевая возможность для построения агентных пайплайнов.

Третье — контекстное окно расширено до 128K токенов. Это ещё далеко от лидеров рынка (Gemini 2.5 Pro — 2M, Claude Opus 4.7 — 500K), но достаточно для большинства корпоративных сценариев: анализа договорной документации, агрегации длинных отчётов, работы с базой знаний среднего размера.

Где модель сильна и где уступает

По публично доступным сравнениям, Yandex GPT 5 Pro заметно лучше предыдущей версии справляется с задачами, требующими знания российского контекста: цитирование нормативных актов, работа с локальной деловой терминологией, генерация документов в формате, привычном для российских компаний. На англоязычных бенчмарках вроде MMLU-Pro модель пока показывает результаты на уровне GPT-4o образца 2024 года, что заметно ниже текущих топовых моделей западных вендоров.

Это укладывается в позиционирование Яндекса. Компания не пытается конкурировать с OpenAI и Anthropic за глобальный рынок, а строит локального оператора, чьи преимущества — близость к российским заказчикам, юридическая определённость данных и поддержка специфичных корпоративных сценариев.

Цены и доступность

На время беты использование Yandex GPT 5 Pro бесплатное в пределах квоты в 100 тысяч токенов в сутки на аккаунт. После перехода в общую доступность Яндекс анонсировал стоимость на уровне 1,2 руб за 1K input-токенов и 4,8 руб за 1K output-токенов. Это сопоставимо с тарифами GigaChat от Сбера и заметно дешевле западных аналогов в пересчёте по курсу.

Отдельно компания анонсировала расширение region availability — модель доступна не только в дата-центрах в России, но и в Узбекистане и Казахстане. Это важно для команд, работающих на рынки СНГ под локальными требованиями по data residency.

По мотивам: Yandex Cloud blog, техническая документация платформы.