← heapsort-ai

low-latency

4 items

RESEARCHDEV.to AI·7/5/2026

VideoLLM runs live video QA at 2 FPS

Un nuevo sistema VideoLLM llamado AURA permite responder preguntas en tiempo real sobre video en vivo a 2 FPS, superando las limitaciones de modelos anteriores que solo procesaban clips pregrabados o tenían dificultades con la transmisión continua. AURA logra una latencia limitada al unificar un codificador de video con un LLM y emplear un historial de ventana deslizante con cachés de clave-valor de prefijo reutilizables.

28