Towards Scalable Lightweight GUI Agents via Multi-role Orchestration
Este artículo propone el framework LAMO para abordar el desafío de desplegar agentes GUI autónomos ligeros impulsados por MLLMs en dispositivos con recursos limitados. LAMO mejora los MLLMs ligeros con conocimiento específico de GUI y escalabilidad de tareas mediante orquestación de múltiples roles.