AI performance

27 items

ARTICLEDEV.to AI·18/4/2026

I scored 500 AI prompts across 8 quality dimensions — here's what broke

El autor calificó 500 prompts de IA utilizando una rúbrica de 8 dimensiones, encontrando que los prompts de producción promedian solo 13-16 de 80 puntos. Esto indica que la mayoría de los equipos están subutilizando significativamente sus modelos LLM debido a la mala calidad de los prompts.

prompt-engineering AI performance LLM

ARTICLELangChain Blog·2/4/2026

Open Models have crossed a threshold

Modelos abiertos como GLM-5 y MiniMax M2.7 han cruzado un umbral, igualando a los modelos frontera cerrados en tareas centrales de agente. Ofrecen un rendimiento comparable en operaciones de archivo, uso de herramientas y seguimiento de instrucciones, con una fracción del costo y la latencia.

open models AI performance MiniMax M2.7 GLM-5

ARTICLEDEV.to AI·8/4/2026

Why OpenClaw Agents Lose Their Minds Mid-Session (And What It Takes to Fix It)

Este artículo explora las razones por las cuales los agentes de OpenClaw pueden fallar o comportarse de manera impredecible a mitad de la sesión. También aborda las medidas y estrategias necesarias para identificar y corregir estos problemas de estabilidad.

debugging AI AI Stability AI performance AI agents

ARTICLEDEV.to AI·9/4/2026

MIT Sent AI to Do Our Jobs. It Struggled.

Um estudo do MIT testou agentes de IA em milhares de tarefas do mundo real, revelando que eles tiveram dificuldades em atividades que exigem presença física, julgamento contextual ou confiança humana. Isso destaca a lacuna entre o que a IA pode fazer em demonstrações controladas e sua performance em trabalhos complexos, onde as habilidades humanas permanecem cruciais.

human skills AI limitations MIT research AI performance

ARTICLE↑ trendingReddit r/MachineLearning·9/4/2026

AI Systems Performance Engineering by Chris Fregly - is it worth it? [D]

O usuário busca recomendações de livros para aprender sobre otimização e alto desempenho em Machine Learning e Deep Learning. Ele compara dois títulos: 'AI Systems Performance Engineering' e 'Machine Learning Systems'.

Book Recommendation deep learning Machine Learning Optimization AI performance

ARTICLEDEV.to AI·hace 27d

Why Has Claude's Performance Dropped Lately? Anthropic Admits the Issue, and Here Are the 3 Reasons Why

Los usuarios de Claude AI han notado una caída significativa en el rendimiento del modelo, con pruebas reunidas por algunos. Anthropic, el desarrollador de Claude, ha admitido el problema y ha prometido explicar las tres razones de la disminución de la calidad.

User feedback Claude AI LLM issues Anthropic

ARTICLE↑ trendingReddit r/LocalLLaMA·19/4/2026

Speculative decoding question, 665% speed increase

Una pregunta sobre la decodificación especulativa destaca un notable aumento de velocidad del 665%. Este tema sugiere una discusión técnica sobre la optimización de modelos de IA.

deep learning AI performance model optimization speed improvement