Inference-time scaling: что говорят кривые reasoning-моделей и сколько это стоит
Reasoning-режимы у o1, Claude и Gemini подняли качество за счёт затрат на инференс. Анализируем кривые «компьют против качества» и оцениваем, когда такие модели экономически оправданы.