RESEARCH54
Improving Multimodal Reasoning via Worst Dimension Optimization
arXiv CS.AI·9 juin 2026
Le raisonnement multimodal exige le maintien de l'intégrité à travers diverses contraintes, telles que l'ancrage visuel et la cohérence logique. Les modèles de récompense de processus actuels masquent souvent les défaillances de dimensions individuelles en pondérant les facteurs de manière égale, compromettant le processus de raisonnement global.
Lire l'original ↗