← heapsort-ai

software quality

9 items

ARTICLEDEV.to AI·vor 28T

One AI Model Scored 99. I Still Voted for the One That Scored 95.

Ein Autor bevorzugte ein KI-Modell mit einer niedrigeren technischen Bewertung (95) gegenüber einem mit einer höheren (99) aufgrund einer besseren Benutzererfahrung. Dies unterstreicht, dass "gut aussehen", "gut bewerten" und "sich richtig anfühlen" drei unterschiedliche Urteile für KI-generierte Software sind, die nicht immer zum gleichen Gewinner führen.

28
ARTICLEDEV.to AI·vor 15T

Vibe Coding Problems: 7 Visual Bugs AI Code Generators Always Ship

KI-generierte Anwendungen weisen häufig visuelle Fehler wie Layout-Überlappungen, falsche Abstände und inkonsistente Farben auf, anstatt funktionaler Probleme. Diese Fehler entstehen, weil KI-Codegeneratoren Designs und Markenfarben nur annähern, anstatt exakte Spezifikationen anzuwenden, was zu einem „falschen“ Benutzererlebnis über mehrere Komponenten hinweg führt.

27
ARTICLEDEV.to AI·4/24/2026

Anthropic just admitted Claude Code broke. Here's exactly what happened, what they fixed, and what it means for your workflows.

Anthropic gab zu, dass die Qualität von Claude Code aufgrund von drei Produktänderungen, nicht des zugrunde liegenden Modells, nach Beschwerden von Ingenieuren über flachere Argumentation und schlechtere Codequalität, nachgelassen hatte. Alle drei Probleme wurden bis zum 20. April (v2.1.116) behoben, und ein vollständiger Postmortem-Bericht erklärt die Situation.

27