← heapsort-ai

multimodal models

2 items

RESEARCHarXiv CS.AI·01/05/2026

Step-level Optimization for Efficient Computer-use Agents

Esta pesquisa aponta a ineficiência dos agentes atuais de uso de computador, que utilizam modelos multimodais grandes para cada interação de interface gráfica. Argumenta que as tarefas são heterogêneas, com passos rotineiros exigindo menos processamento, enquanto erros se concentram em momentos de alto risco como travamentos ou desvio semântico, necessitando otimização direcionada.

27
RESEARCHarXiv CS.AI·28d atrás

Auto-Rubric as Reward: From Implicit Preferences to Explicit Multimodal Generative Criteria

Este artigo de pesquisa apresenta o Auto-Rubric as Reward (ARR), uma nova estrutura para alinhar modelos generativos multimodais com as preferências humanas. O ARR transforma o conhecimento implícito de preferência de um VLM em rubricas explícitas e específicas do prompt, decompondo o julgamento humano em dimensões de qualidade verificáveis para superar as limitações das abordagens tradicionais de RLHF.

27