RESEARCH46
Improving Multimodal Reasoning via Worst Dimension Optimization
arXiv CS.AI·9. Juni 2026
Multimodales Denken erfordert die Integrität über verschiedene Einschränkungen hinweg, wie visuelle Erdung und logische Konsistenz. Aktuelle Prozess-Belohnungsmodelle verdecken oft individuelle Dimensionsfehler, indem sie Faktoren gleich gewichten, was den gesamten Denkprozess beeinträchtigt.
Original lesen ↗