GUI agents

4 items

RESEARCHarXiv CS.AI·16/04/2026

Towards Scalable Lightweight GUI Agents via Multi-role Orchestration

Cet article propose le framework LAMO pour relever le défi du déploiement d'agents GUI autonomes légers alimentés par des MLLM sur des appareils aux ressources limitées. LAMO améliore les MLLM légers avec des connaissances spécifiques à l'interface graphique et une évolutivité des tâches grâce à une orchestration multi-rôles.

AI frameworks MLLMs resource optimization multi-agent systems

RESEARCHarXiv CS.AI·14/04/2026

Turing Test on Screen: A Benchmark for Mobile GUI Agent Humanization

L'article introduit le "Turing Test on Screen" pour modéliser l'anti-détection des agents GUI autonomes, soulignant l'importance de l'humanisation pour leur survie dans les écosystèmes numériques. Il établit le Benchmark d'Humanisation des Agents (AHB) et propose des méthodes pour améliorer l'imitabilité et l'utilité des agents, en utilisant un nouveau jeu de données de dynamiques tactiles mobiles.

humanization Turing Test Mobile AI Anti-detection

RESEARCHarXiv CS.AI·16/04/2026

RiskWebWorld: A Realistic Interactive Benchmark for GUI Agents in E-commerce Risk Management

RiskWebWorld est présenté comme le premier benchmark interactif très réaliste pour évaluer les agents d'interface graphique dans la gestion des risques du commerce électronique, comblant le manque d'exploration dans les domaines d'enquête à enjeux élevés. Il propose 1 513 tâches issues de pipelines de contrôle des risques de production et une infrastructure compatible Gymnasium pour une évaluation évolutive, révélant un écart de capacités significatif.

AI models evaluation Benchmarking e-commerce GUI agents

RESEARCHarXiv CS.LG·06/04/2026

UI-Oceanus: Scaling GUI Agents with Synthetic Environmental Dynamics

UI-Oceanus é uma estrutura que escala agentes GUI generalistas, focando em dominar a física da interação através de feedback ambiental em vez de imitar trajetórias. O sistema utiliza exploração autônoma e predição de dinâmicas futuras para construir um modelo de mundo interno robusto, superando limitações de dados e supervisão.

self-supervised learning generative models world model scaling