← heapsort-ai

AI performance

27 items

ARTICLELangChain Blog·2/4/2026

Open Models have crossed a threshold

Modelos abiertos como GLM-5 y MiniMax M2.7 han cruzado un umbral, igualando a los modelos frontera cerrados en tareas centrales de agente. Ofrecen un rendimiento comparable en operaciones de archivo, uso de herramientas y seguimiento de instrucciones, con una fracción del costo y la latencia.

Open Models have crossed a threshold
27
ARTICLEDEV.to AI·9/4/2026

MIT Sent AI to Do Our Jobs. It Struggled.

Um estudo do MIT testou agentes de IA em milhares de tarefas do mundo real, revelando que eles tiveram dificuldades em atividades que exigem presença física, julgamento contextual ou confiança humana. Isso destaca a lacuna entre o que a IA pode fazer em demonstrações controladas e sua performance em trabalhos complexos, onde as habilidades humanas permanecem cruciais.

26