← heapsort-ai

GUI automation

2 items

ARTICLEDEV.to AI·13/04/2026

Open-Sourcing Mano-P Today: Pure Vision GUI Agent, OSWorld #1, Apache 2.0

Mano-P, um agente de GUI de visão pura, foi disponibilizado como código aberto sob a licença Apache 2.0, destacando-se por interagir com telas de computador apenas através de capturas de tela. Ele se sobressai por seu desempenho superior em benchmarks OSWorld e prioriza a privacidade ao rodar no dispositivo, servindo como uma base para o desenvolvimento de IA personalizada.

27
RESEARCHarXiv CS.AI·01/05/2026

Step-level Optimization for Efficient Computer-use Agents

Esta pesquisa aponta a ineficiência dos agentes atuais de uso de computador, que utilizam modelos multimodais grandes para cada interação de interface gráfica. Argumenta que as tarefas são heterogêneas, com passos rotineiros exigindo menos processamento, enquanto erros se concentram em momentos de alto risco como travamentos ou desvio semântico, necessitando otimização direcionada.

27