heapsort
RESEARCH46

Improving Multimodal Reasoning via Worst Dimension Optimization

arXiv CS.AI·9. Juni 2026

Multimodales Denken erfordert die Integrität über verschiedene Einschränkungen hinweg, wie visuelle Erdung und logische Konsistenz. Aktuelle Prozess-Belohnungsmodelle verdecken oft individuelle Dimensionsfehler, indem sie Faktoren gleich gewichten, was den gesamten Denkprozess beeinträchtigt.

Original lesen