← heapsort-ai

automated testing

6 items

ARTICLEDEV.to AI·5/9/2026

I built the same MVP twice. The autonomous agent wrote 4.6x more tests — none caught two stubbed core methods.

Der Autor hat denselben MVP zweimal erstellt und dabei kuratierte KI-Unterstützung (Claude Code, Codex) mit einem autonomen Agenten (Factory.ai's Droid) verglichen. Der autonome Agent generierte 4,6-mal mehr Tests, übersah jedoch zwei "stubbed" Kernmethoden, was zu einer nicht funktionierenden CLI führte.

27
RESEARCHarXiv CS.AI·4/14/2026

OpeFlo: Automated UX Evaluation via Simulated Human Web Interaction with GUI Grounding

OpenFlo ist ein KI-Agent, der die Web-Usability-Bewertung automatisiert, indem er menschliche Interaktion auf echten Webseiten mit GUI-Grundlage simuliert, im Gegensatz zu traditionellen DOM-basierten Tools. Es integriert Standardmetriken wie SUS und SEQ sowie gleichzeitiges Think Aloud, um umfassende User Experience (UX)-Berichte zu erstellen und so die Produktentwicklung zu beschleunigen.

27