Модели Archives - ContextWindow

Модели

Anthropic выпустила Claude Opus 4.7: что меняется для разработчиков и команд

Новый флагман Anthropic получил расширенный контекст до 500K токенов, нативное использование инструментов в режиме рассуждения и улучшенный coding-бенчмарк SWE-bench Verified на уровне 78,4%. Разбираем, для каких задач это уже сегодня меняет рабочий процесс.

24 мая 3 мин

Модели

Yandex GPT 5 Pro: открытое тестирование и расширение API

Яндекс начал бета-доступ к новой версии модели. Заявленный рост качества на русскоязычных задачах рассуждения — до 22% по внутреннему бенчмарку, расширен набор инструментов API. Что вошло в релиз и где ещё видны ограничения.

23 мая 3 мин

Модели

OpenAI обновила GPT-5o: голос и зрение в реальном времени, новый ценовой тир

Релиз сокращает задержку голосового и визуального ввода до уровня естественного диалога и вводит промежуточную тарифную ступень между Mini и стандартной моделью. Главные изменения и их практический эффект для команд, строящих real-time-приложения.

22 мая 3 мин

Модели

Gemini 2.5 Pro лидирует на RULER-2M: что показал бенчмарк длинного контекста

Модель Google DeepMind заняла первое место на новом бенчмарке длинного контекста с 2 миллионами токенов. Разбираем, в чём именно она опередила конкурентов, и какие ограничения этот результат не закрывает.

21 мая 3 мин

Модели

HuggingFace выпустил SmolLM3: 3B-модель уровня 7B-класса

Дистилляция и пересборка тренировочного корпуса дали результат, опередивший Mistral 7B на восьми из десяти задач MMLU-Pro. Что стоит за этим скачком и почему это важно для команд, работающих на edge-устройствах.

20 мая 3 мин

Модели

Mistral открыла веса Codestral 2: что предлагает новая код-модель

Компания выложила модель под Apache 2.0 и опубликовала результаты на семи coding-бенчмарках. По ключевым метрикам Codestral 2 близка к DeepSeek-Coder и опережает Qwen-2.5-Coder в той же весовой категории.

19 мая 3 мин

Модели

Llama 4 MoE: что архитектура Meta меняет для команд на self-hosted-инфраструктуре

Релиз Llama 4 продолжил курс Meta на mixture-of-experts. Сравнение с DeepSeek-V3 показывает близкие результаты на бенчмарках при разных компромиссах по требованиям к VRAM. Что это значит для команд, выбирающих open-weight-стек.

15 мая 3 мин

Модели

Anthropic заявляет о достижении $4 млрд ARR на корпоративном сегменте

По данным компании, годовая выручка по подписке достигла $4 млрд при росте за квартал на 28%. Основной драйвер — корпоративный сегмент и интеграция Claude Code в кодовые базы крупных технологических компаний.

12 мая 3 мин