Stop Shipping AI on Toy Datasets: How to Treat Synthetic Data as Infrastructure
L'article soutient que l'utilisation de "jeux de données jouets" pour les tests d'IA viole un contrat tacite, entraînant des échecs de déploiement. Il propose de traiter les données synthétiques comme une infrastructure robuste — standardisée, versionnée et surveillée — plutôt que comme du simple code "glue", illustré par SyntheholDB.
