heapsort
ARTICLE24

We Hit 99.1% on the LOCOMO Benchmark. Here's How.

DEV.to AI·12 avril 2026

Une équipe a atteint 99,1% sur le benchmark LOCOMO, qui évalue le raisonnement multi-saut des agents IA avec mémoire. Ce succès est dû à la suppression d'une seule prémisse, et non à un nouveau modèle complexe.

Lire l'original