RESEARCH30
Temperature-Dependent Performance of Prompting Strategies in Extended Reasoning Large Language Models
arXiv CS.CL·13 avril 2026
Cette étude évalue les performances des stratégies de prompting (chain-of-thought et zéro-shot) dans les LLM à raisonnement étendu comme Grok-4.1, en faisant varier la température d'échantillonnage sur 39 problèmes mathématiques complexes. Il a été constaté que le prompting zéro-shot atteint des performances optimales à des températures modérées, tandis que le chain-of-thought est plus efficace aux températures extrêmes, augmentant le bénéfice du raisonnement étendu.
Lire l'original ↗