ARTICLE24
We Hit 99.1% on the LOCOMO Benchmark. Here's How.
DEV.to AI·12 de abril de 2026
Un equipo alcanzó el 99,1% en el benchmark LOCOMO, que evalúa el razonamiento multi-salto de agentes de IA usando memorias. Este avance se logró al eliminar una única premisa, no mediante un modelo complejo.
Leer original ↗