← heapsort-ai

low-latency

4 items

RESEARCHDEV.to AI·07/05/2026

VideoLLM runs live video QA at 2 FPS

Um novo sistema VideoLLM chamado AURA permite perguntas e respostas em tempo real para vídeo ao vivo a 2 FPS, superando as limitações de modelos anteriores que processavam apenas clipes pré-gravados ou tinham dificuldade com streaming contínuo. O AURA atinge latência limitada ao unificar um codificador de vídeo com um LLM e empregar um histórico de janela deslizante com caches de chave-valor de prefixo reutilizáveis.

28