AI performance

27 items

ARTICLEDEV.to AI·4/18/2026

I scored 500 AI prompts across 8 quality dimensions — here's what broke

Der Autor bewertete 500 KI-Prompts anhand von 8 Qualitätsdimensionen und stellte fest, dass durchschnittliche Produktions-Prompts lediglich 13-16 von 80 Punkten erreichen. Dies deutet darauf hin, dass die meisten Teams ihre LLM-Modelle aufgrund schlechter Prompt-Qualität erheblich unterauslasten.

prompt-engineering AI performance LLM

ARTICLELangChain Blog·4/2/2026

Open Models have crossed a threshold

Offene Modelle wie GLM-5 und MiniMax M2.7 haben eine Schwelle überschritten und erreichen bei zentralen Agentenaufgaben die Leistung geschlossener Spitzenmodelle. Sie bieten vergleichbare Leistung bei Dateivorgängen, Werkzeugnutzung und der Befolgung von Anweisungen, jedoch zu einem Bruchteil der Kosten und Latenz.

open models AI performance MiniMax M2.7 GLM-5

ARTICLEDEV.to AI·4/8/2026

Why OpenClaw Agents Lose Their Minds Mid-Session (And What It Takes to Fix It)

Dieser Artikel untersucht die Gründe, warum OpenClaw-Agenten während einer Sitzung scheitern oder unvorhersehbar reagieren können. Er erörtert auch die notwendigen Maßnahmen und Strategien, um diese Stabilitätsprobleme zu identifizieren und zu beheben.

debugging AI AI Stability AI performance AI agents

ARTICLEDEV.to AI·4/9/2026

MIT Sent AI to Do Our Jobs. It Struggled.

Um estudo do MIT testou agentes de IA em milhares de tarefas do mundo real, revelando que eles tiveram dificuldades em atividades que exigem presença física, julgamento contextual ou confiança humana. Isso destaca a lacuna entre o que a IA pode fazer em demonstrações controladas e sua performance em trabalhos complexos, onde as habilidades humanas permanecem cruciais.

human skills AI limitations MIT research AI performance

ARTICLE↑ trendingReddit r/MachineLearning·4/9/2026

AI Systems Performance Engineering by Chris Fregly - is it worth it? [D]

O usuário busca recomendações de livros para aprender sobre otimização e alto desempenho em Machine Learning e Deep Learning. Ele compara dois títulos: 'AI Systems Performance Engineering' e 'Machine Learning Systems'.

Book Recommendation deep learning Machine Learning Optimization AI performance

ARTICLEDEV.to AI·vor 27T

Why Has Claude's Performance Dropped Lately? Anthropic Admits the Issue, and Here Are the 3 Reasons Why

Nutzer von Claude AI haben einen deutlichen Leistungsabfall des Modells bemerkt, wobei einige sogar Beweise gesammelt haben. Anthropic, der Entwickler von Claude, hat das Problem zugegeben und versprochen, die drei Gründe für den Qualitätsrückgang zu erläutern.

User feedback Claude AI LLM issues Anthropic

ARTICLE↑ trendingReddit r/LocalLLaMA·4/19/2026

Speculative decoding question, 665% speed increase

Eine Frage zur spekulativen Dekodierung hebt eine bemerkenswerte Geschwindigkeitssteigerung von 665 % hervor. Dieses Thema deutet auf eine technische Diskussion über die Optimierung von KI-Modellen hin.

deep learning AI performance model optimization speed improvement