← heapsort-ai

AI performance

27 items

ARTICLELangChain Blog·02/04/2026

Open Models have crossed a threshold

Les modèles ouverts comme GLM-5 et MiniMax M2.7 ont franchi un seuil, égalant les modèles frontières fermés pour les tâches d'agent essentielles. Ils offrent des performances comparables en opérations de fichiers, utilisation d'outils et suivi d'instructions, mais à une fraction du coût et de la latence.

Open Models have crossed a threshold
27
ARTICLEDEV.to AI·09/04/2026

MIT Sent AI to Do Our Jobs. It Struggled.

Um estudo do MIT testou agentes de IA em milhares de tarefas do mundo real, revelando que eles tiveram dificuldades em atividades que exigem presença física, julgamento contextual ou confiança humana. Isso destaca a lacuna entre o que a IA pode fazer em demonstrações controladas e sua performance em trabalhos complexos, onde as habilidades humanas permanecem cruciais.

26