Mistral открыла веса Codestral 2: что предлагает новая код-модель

Компания выложила модель под Apache 2.0 и опубликовала результаты на семи coding-бенчмарках. По ключевым метрикам Codestral 2 близка к DeepSeek-Coder и опережает Qwen-2.5-Coder в той же весовой категории.

Mistral 19 мая опубликовала веса Codestral 2 — специализированной code-модели на 22 миллиарда параметров с лицензией Apache 2.0. Это первый коммерчески пригодный open-weight-релиз компании в 2026 году и продолжение её стратегии «открытое ядро, платные интеграции», обозначенной ещё в годовом обзоре 2025.

Codestral 2 поддерживает 86 языков программирования. Контекстное окно — 256K токенов, что превышает предыдущую версию вдвое. Модель доступна для скачивания на HuggingFace и в нескольких пре-конвертированных форматах (GGUF, MLX, AWQ) от сторонних мейнтейнеров.

Бенчмарки и позиционирование

Mistral опубликовала результаты на семи бенчмарках: HumanEval, MBPP, MultiPL-E, RepoBench, CRUXEval, SWE-bench Lite и собственном внутреннем тесте на рефакторинг. На HumanEval Codestral 2 показывает 89,4% pass@1, что сопоставимо с DeepSeek-Coder-V2 (89,7%) и опережает Qwen-2.5-Coder-32B (87,1%). На SWE-bench Lite результат скромнее — 38,6%, что заметно ниже SWE-bench Verified для закрытых моделей, но это сравнение разных тестов.

Главный аргумент Mistral — соотношение качества к размеру. Codestral 2 в формате 4-бит квантизации помещается в 12 ГБ VRAM, что делает её пригодной для локального запуска на потребительских GPU вроде RTX 4080. Это важно для команд, у которых требования compliance не позволяют отправлять код во внешние API.

Что нового в архитектуре

Компания указывает три технических улучшения относительно первой Codestral. Первое — переработанный токенизатор с расширенным словарём для редких языков (Erlang, OCaml, Verilog). Второе — fill-in-the-middle обучение, при котором модель видит маскированный кусок кода и предсказывает его на основе контекста до и после. Это критично для качества code-completion в IDE-сценариях. Третье — дообучение на корпусе многофайловых задач, что отражается на результатах RepoBench.

Технических деталей о составе тренировочного датасета Mistral не раскрывает — публикация ограничивается общими формулировками «открытые репозитории, отфильтрованные по лицензии». Это создаёт неопределённость для enterprise-клиентов, которым важно понимать происхождение обучающих данных для compliance-аудитов.

Где это полезно сейчас

Codestral 2 закрывает несколько практических сценариев:

Локальный code-completion в офлайн-IDE-интеграциях — для команд с требованиями к отсутствию исходящего трафика.
Self-hosted-эндпоинты для крупных корпораций, где политика безопасности запрещает использование внешних API.
Базовая модель для дообучения под специфический внутренний фреймворк или DSL.

На задачах агентного программирования с многошаговым tool use Codestral 2 уступает закрытым моделям — Claude Opus 4.7 и GPT-5o остаются предпочтительным выбором для Cursor, Aider и аналогичных интеграций. Mistral сама не позиционирует модель как агентного coding-агента, а скорее как универсальный code-completion-движок.

Релиз также подтверждает курс Mistral на open-core-стратегию: базовые модели открыты, монетизация идёт через La Plateforme (платный API), enterprise-поддержку и кастомные деплоинги. На фоне европейского регуляторного давления это позиционирование сильнее, чем у американских конкурентов, удерживающих веса закрытыми.

По мотивам: Mistral AI announcements, HuggingFace model card.

Mistral открыла веса Codestral 2: что предлагает новая код-модель

Бенчмарки и позиционирование

Что нового в архитектуре

Где это полезно сейчас

Связанное

Anthropic выпустила Claude Opus 4.7: что меняется для разработчиков и команд

Yandex GPT 5 Pro: открытое тестирование и расширение API

OpenAI обновила GPT-5o: голос и зрение в реальном времени, новый ценовой тир