RESEARCH27
$E^3$-Agent: An Executable and Evolving Agent for Resource Management of Edge Generative Inference
arXiv CS.LG·28 de mayo de 2026
Este artículo presenta $E^3$-Agent, un agente ejecutable y evolutivo para la gestión de recursos en implementaciones de contenido generado por IA (AIGC) en el borde. Aborda los desafíos de rendimiento desconocido y no estacionario en la inferencia generativa en dispositivos de borde, separando un enrutador de ruta rápida de un meta-controlador LLM para la asignación adaptativa de recursos y la mitigación de cambios de régimen.
Leer original ↗