RESEARCH27
Turing Test on Screen: A Benchmark for Mobile GUI Agent Humanization
arXiv CS.AI·14 de abril de 2026
El artículo presenta el "Turing Test on Screen" para modelar la anti-detección de agentes GUI autónomos, destacando la humanización para su supervivencia en ecosistemas digitales. Establece el Agent Humanization Benchmark (AHB) y propone métodos para mejorar la imitabilidad y utilidad de los agentes, usando un nuevo conjunto de datos de dinámicas táctiles móviles.
Leer original ↗