Towards Scalable Lightweight GUI Agents via Multi-role Orchestration
Este artigo propõe o framework LAMO para enfrentar o desafio de implementar agentes GUI autônomos baseados em MLLMs leves em dispositivos com recursos limitados. O LAMO aprimora MLLMs leves com conhecimento específico de GUI e escalabilidade de tarefas por meio de orquestração multi-funções.