RESEARCH28
Epidemiology of Model Collapse: Modeling Synthetic Data Contamination via Bilayer SIR Dynamics
arXiv CS.CL·5 juin 2026
L'article propose un cadre SIR/SIRS bicouche pour modéliser la contamination des données synthétiques et l'effondrement des modèles dans l'écosystème de l'IA. Ce modèle phénoménologique de champ moyen traite les corpus de données et les modèles d'IA comme des populations interagissantes, dérivant un nombre de reproduction de base pour analyser la contamination croisée.
Lire l'original ↗