RESEARCHarXiv CS.LG·15/4/2026
When Reasoning Models Hurt Behavioral Simulation: A Solver-Sampler Mismatch in Multi-Agent LLM Negotiation
Este artículo examina cómo la mejora del razonamiento en los modelos de lenguaje puede perjudicar la fidelidad de las simulaciones de comportamiento, especialmente cuando el objetivo es muestrear comportamientos racionalmente limitados en lugar de resolver un problema estratégico. Los autores identifican un "desajuste entre solucionador y muestreador" donde los LLM optimizan en exceso, colapsando los comportamientos orientados al compromiso y resultando en diversidad sin fidelidad en los resultados.
27