heapsort
RESEARCH28

Epidemiology of Model Collapse: Modeling Synthetic Data Contamination via Bilayer SIR Dynamics

arXiv CS.CL·5. Juni 2026

Das Papier schlägt ein bilayer SIR/SIRS-Framework vor, um die Kontamination synthetischer Daten und den Modellkollaps im KI-Ökosystem zu modellieren. Dieses phänomenologische Mean-Field-Modell behandelt Datenkorpora und KI-Modelle als interagierende Populationen und leitet eine Basisreproduktionszahl ab, um Kreuzkontaminationen zu analysieren.

Original lesen