MMMU-Pro: что измеряет новый мультимодальный бенчмарк и где сейчас лидеры
Расширенная версия MMMU добавляет задачи с фильтрацией визуальных дистракторов и многошаговое визуальное рассуждение. Разбираем, чем отличается от предшественника и какие модели сейчас лидируют.