RESEARCHarXiv CS.CL·4/13/2026
Temperature-Dependent Performance of Prompting Strategies in Extended Reasoning Large Language Models
Diese Studie bewertet die Leistung von Prompting-Strategien (Chain-of-Thought und Zero-Shot) in LLMs mit erweitertem Schlussfolgern wie Grok-4.1, wobei die Sampling-Temperatur bei 39 anspruchsvollen mathematischen Problemen variiert wurde. Dabei wurde festgestellt, dass Zero-Shot-Prompting bei moderaten Temperaturen seinen Höhepunkt erreicht, während Chain-of-Thought bei extremen Temperaturen am besten abschneidet und den Nutzen des erweiterten Schlussfolgerns erheblich steigert.
30