ContextWindow
Тег

#meta

Модели

Llama 4 MoE: что архитектура Meta меняет для команд на self-hosted-инфраструктуре

Релиз Llama 4 продолжил курс Meta на mixture-of-experts. Сравнение с DeepSeek-V3 показывает близкие результаты на бенчмарках при разных компромиссах по требованиям к VRAM. Что это значит для команд, выбирающих open-weight-стек.