RESEARCH54

Improving Multimodal Reasoning via Worst Dimension Optimization

arXiv CS.AI·9 juin 2026

Le raisonnement multimodal exige le maintien de l'intégrité à travers diverses contraintes, telles que l'ancrage visuel et la cohérence logique. Les modèles de récompense de processus actuels masquent souvent les défaillances de dimensions individuelles en pondérant les facteurs de manière égale, compromettant le processus de raisonnement global.

Optimization multimodal AI machine learning AI Reasoning

Lire l'original ↗