heapsort
RESEARCH27

ReVision: Scaling Computer-Use Agents via Temporal Visual Redundancy Reduction

arXiv CS.CL·13. Mai 2026

ReVision stellt eine Methode zur Skalierung von Computernutzungsagenten vor, indem die zeitliche visuelle Redundanz in Interaktionstrajektorien reduziert wird. Es verwendet einen gelernten Patch-Selektor, um redundante visuelle Token zu entfernen, was den Token-Verbrauch um etwa 46% senkt und die Effizienz für multimodale Sprachmodelle über Benchmarks hinweg verbessert.

Original lesen