Модели
Новый флагман Anthropic получил расширенный контекст до 500K токенов, нативное использование инструментов в режиме рассуждения и улучшенный coding-бенчмарк SWE-bench Verified на уровне 78,4%. Разбираем, для каких задач это уже сегодня меняет рабочий процесс.
24 мая
3 мин
Модели
Яндекс начал бета-доступ к новой версии модели. Заявленный рост качества на русскоязычных задачах рассуждения — до 22% по внутреннему бенчмарку, расширен набор инструментов API. Что вошло в релиз и где ещё видны ограничения.
23 мая
3 мин
Модели
Релиз сокращает задержку голосового и визуального ввода до уровня естественного диалога и вводит промежуточную тарифную ступень между Mini и стандартной моделью. Главные изменения и их практический эффект для команд, строящих real-time-приложения.
22 мая
3 мин