← heapsort-ai

automated testing

6 items

ARTICLEDEV.to AI·09/05/2026

I built the same MVP twice. The autonomous agent wrote 4.6x more tests — none caught two stubbed core methods.

L'auteur a construit le même MVP deux fois, comparant l'assistance IA curée (Claude Code, Codex) avec un agent autonome (Factory.ai's Droid). L'agent autonome a généré 4,6 fois plus de tests mais n'a pas réussi à détecter deux méthodes clés "stubbed", ce qui a entraîné une CLI non fonctionnelle.

27
RESEARCHarXiv CS.AI·14/04/2026

OpeFlo: Automated UX Evaluation via Simulated Human Web Interaction with GUI Grounding

OpenFlo est un agent d'IA qui automatise l'évaluation de l'utilisabilité web en simulant l'interaction humaine sur de vraies pages web avec un ancrage GUI, contrairement aux outils traditionnels. Il intègre des métriques standard comme SUS et SEQ, ainsi que le Think Aloud, pour générer des rapports UX complets, accélérant le développement de produits.

27