heapsort
RESEARCH28

Epidemiology of Model Collapse: Modeling Synthetic Data Contamination via Bilayer SIR Dynamics

arXiv CS.CL·5 de junio de 2026

El artículo propone un marco SIR/SIRS bicapa para modelar la contaminación de datos sintéticos y el colapso de modelos en el ecosistema de IA. Este modelo fenomenológico de campo medio trata los corpus de datos y los modelos de IA como poblaciones interactuantes, derivando un número de reproducción básico para analizar la contaminación cruzada.

Leer original