ARTICLE24

We Hit 99.1% on the LOCOMO Benchmark. Here's How.

DEV.to AI·12 de abril de 2026

Un equipo alcanzó el 99,1% en el benchmark LOCOMO, que evalúa el razonamiento multi-salto de agentes de IA usando memorias. Este avance se logró al eliminar una única premisa, no mediante un modelo complejo.

Memory Systems benchmarking Reasoning AI AI agents

Leer original ↗