RESEARCHarXiv CS.AI·vor 14T
How Much Thinking is Enough? Quantifying and Understanding Redundancy in LLM Reasoning
Dieses Papier quantifiziert und erklärt Redundanz im Denken großer Sprachmodelle (LLMs), indem es das Konzept formalisiert und in großem Maßstab misst. Die Forschung zeigt, dass zwischen 61% und 93% der Denkprozesse von LLMs unnötig sind, was Latenz, GPU-Zeit und Energieverbrauch beeinflusst.
27