Pourquoi dépenser du calcul à l'inférence : CoT, o1/o3, DeepSeek-R1 (GRPO, « aha moment »), best-of-N, PRM, recherche, lois de scaling, limites.