ARTICLE24
We Hit 99.1% on the LOCOMO Benchmark. Here's How.
DEV.to AI·12 avril 2026
Une équipe a atteint 99,1% sur le benchmark LOCOMO, qui évalue le raisonnement multi-saut des agents IA avec mémoire. Ce succès est dû à la suppression d'une seule prémisse, et non à un nouveau modèle complexe.
Lire l'original ↗