RESEARCH↑ trending43
AutoBe benchmark: structured harness narrows frontier-vs-local gap in backend generation [D]
Reddit r/MachineLearning·4 mai 2026
AutoBe est un nouveau benchmark pour la génération de backend de bout en bout, où les requêtes en langage naturel produisent six sorties structurées via des appels de fonction. Le benchmark révèle que la qualité du backend est plus influencée par la conception du harnais que par le prestige du modèle, avec des modèles locaux performant de manière comparable aux modèles de pointe à un coût nettement inférieur.
Lire l'original ↗