heapsort
RESEARCH27

Incentivizing Neuro-symbolic Language-based Reasoning in VLMs via Reinforcement Learning

arXiv CS.CL·27 de abril de 2026

Este trabajo explora el razonamiento en lenguaje neuro-simbólico en VLMs, utilizando Aprendizaje por Refuerzo para mejorar las habilidades analíticas y la eficiencia. Logró un aumento del 3,33% en la precisión en un conjunto de datos de visión-lenguaje y una reducción del 75% en los tokens de razonamiento.

Leer original