heapsort
RESEARCH27

Incentivizing Neuro-symbolic Language-based Reasoning in VLMs via Reinforcement Learning

arXiv CS.CL·27 avril 2026

Ce travail explore le raisonnement en langage neuro-symbolique dans les VLMs, utilisant l'apprentissage par renforcement pour améliorer les capacités analytiques et l'efficacité. Il a obtenu une augmentation de 3,33% de la précision sur un ensemble de données vision-langage et une réduction de 75% des tokens de raisonnement.

Lire l'original