← heapsort-ai

Debugging

82 items

ARTICLEDEV.to AI·18/04/2026

Kiwi-chan Progress Report: Steady Mining!

Ce devlog met à jour l'avancement de Kiwi-chan, un bot Minecraft LLM local, détaillant sa progression dans la collecte de ressources comme les bûches de chêne. Il décrit le processus de débogage difficile et la boucle complexe de l'IA qui génère, exécute et réécrit son propre code pour surmonter les échecs dans le monde du jeu.

27
ARTICLEDEV.to AI·15/04/2026

Stop Scrolling Perfetto Timelines: Query Your Traces with SQL and Let AI Find the Bugs

Cet article présente une approche novatrice pour déboguer les performances des applications Android en exploitant des requêtes SQL sur les traces Perfetto et en transmettant les résultats à l'IA pour une analyse automatisée. Cette méthode permet aux développeurs d'identifier et de classer rapidement les goulots d'étranglement de performance, accélérant considérablement le processus d'optimisation par rapport à l'exploration manuelle de la chronologie.

27
NEWSLangChain Blog·il y a 12j

Introducing Langsmith Engine

LangSmith Engine surveille les traces de production, regroupe les défaillances en problèmes nommés et propose des correctifs ciblés ainsi qu'une couverture d'évaluation. Il vise à arrêter le triage manuel des défaillances d'agents.

Introducing Langsmith Engine
27
DOCDEV.to AI·06/05/2026

The "Logic Span": Using OpenTelemetry to Trace Hallucinations

Ce contenu présente la méthode "Logic Span", qui utilise OpenTelemetry pour tracer et déboguer les hallucinations dans les Grands Modèles Linguistiques (LLMs). En encapsulant chaque "Pensée" ou "Étape de Raisonnement" dans un Span OTel dédié, les développeurs peuvent identifier précisément où la logique d'un LLM diverge de son plan initial, traitant les hallucinations comme une trace de pile.

27
ARTICLEDEV.to AI·il y a 11j

I tested an AI agent on a real Godot RPG project. The first script broke.

L'auteur a testé un agent d'IA, Fennara MCP avec Codex, sur un projet RPG Godot existant pour ajouter une nouvelle capacité de combat, notant que le premier script produit était défectueux. De manière cruciale, le système a permis à Godot de fournir des retours diagnostiques immédiats à l'IA, lui permettant de corriger le script et de continuer, démontrant la nécessité d'un feedback en temps réel pour les agents d'IA dans les tâches de développement complexes.

27
ARTICLEDEV.to AI·il y a 18j

Gemma 4 가 갑자기 답을 못 했다 — 외부 협업이 24시간 만에 root cause 찾아낸 이야기

PROJECT JAMES, un système Graph-RAG basé sur Ollama utilisant Gemma 4, a rencontré un problème où le modèle cessait brusquement de répondre à des étapes spécifiques. Après avoir étudié plusieurs hypothèses et collaboré en externe, la cause principale a été identifiée comme une limite max_tokens tronquant la sortie du modèle.

27
ARTICLEDEV.to AI·12/04/2026

Add governance to DSPy pipelines

Le contenu aborde le défi de la surveillance et du débogage des pipelines DSPy, où il est facile de perdre la trace des opérations. Il présente la bibliothèque `asqav` avec `AsqavDSPyCallback` comme solution pour suivre chaque étape, améliorant la gouvernance et l'observabilité.

27