← heapsort-ai

multimodal models

2 items

RESEARCHarXiv CS.AI·1/5/2026

Step-level Optimization for Efficient Computer-use Agents

Esta investigación destaca la ineficiencia de los agentes de uso de computadora actuales, que emplean excesivamente grandes modelos multimodales para cada interacción de interfaz gráfica. Argumenta que las tareas son heterogéneas, con pasos rutinarios que requieren menos cómputo, mientras que los errores se concentran en momentos de alto riesgo como bloqueos o deriva semántica, necesitando optimización dirigida.

27
RESEARCHarXiv CS.AI·hace 28d

Auto-Rubric as Reward: From Implicit Preferences to Explicit Multimodal Generative Criteria

Este artículo de investigación presenta Auto-Rubric as Reward (ARR), un marco novedoso para alinear modelos generativos multimodales con las preferencias humanas. ARR externaliza el conocimiento de preferencias implícitas de un VLM en rúbricas explícitas y específicas del prompt, descomponiendo el juicio humano en dimensiones de calidad verificables de forma independiente para superar las limitaciones de los enfoques tradicionales de RLHF.

27