RESEARCH27
When Reasoning Models Hurt Behavioral Simulation: A Solver-Sampler Mismatch in Multi-Agent LLM Negotiation
arXiv CS.LG·15 avril 2026
Cet article analyse comment le renforcement du raisonnement dans les modèles de langage peut nuire à la fidélité des simulations comportementales, surtout lorsque l'objectif est d'échantillonner des comportements rationnellement limités plutôt que de résoudre un problème stratégique. Les auteurs mettent en évidence un "déséquilibre entre solutionneur et échantillonneur" où les LLM sur-optimisent, réduisant les comportements de compromis et entraînant une diversité sans fidélité dans les résultats.
Lire l'original ↗