RESEARCH30

Temperature-Dependent Performance of Prompting Strategies in Extended Reasoning Large Language Models

arXiv CS.CL·13 avril 2026

Cette étude évalue les performances des stratégies de prompting (chain-of-thought et zéro-shot) dans les LLM à raisonnement étendu comme Grok-4.1, en faisant varier la température d'échantillonnage sur 39 problèmes mathématiques complexes. Il a été constaté que le prompting zéro-shot atteint des performances optimales à des températures modérées, tandis que le chain-of-thought est plus efficace aux températures extrêmes, augmentant le bénéfice du raisonnement étendu.

mathematical reasoning LLMs Prompting Temperature Extended Reasoning

Lire l'original ↗