open-weights Archives - ContextWindow

Модели

HuggingFace выпустил SmolLM3: 3B-модель уровня 7B-класса

Дистилляция и пересборка тренировочного корпуса дали результат, опередивший Mistral 7B на восьми из десяти задач MMLU-Pro. Что стоит за этим скачком и почему это важно для команд, работающих на edge-устройствах.

20 мая 3 мин

Модели

Mistral открыла веса Codestral 2: что предлагает новая код-модель

Компания выложила модель под Apache 2.0 и опубликовала результаты на семи coding-бенчмарках. По ключевым метрикам Codestral 2 близка к DeepSeek-Coder и опережает Qwen-2.5-Coder в той же весовой категории.

19 мая 3 мин

Модели

Llama 4 MoE: что архитектура Meta меняет для команд на self-hosted-инфраструктуре

Релиз Llama 4 продолжил курс Meta на mixture-of-experts. Сравнение с DeepSeek-V3 показывает близкие результаты на бенчмарках при разных компромиссах по требованиям к VRAM. Что это значит для команд, выбирающих open-weight-стек.

15 мая 3 мин