RESEARCHarXiv CS.CL·4d atrás
Epidemiology of Model Collapse: Modeling Synthetic Data Contamination via Bilayer SIR Dynamics
O artigo propõe uma estrutura SIR/SIRS de duas camadas para modelar a contaminação de dados sintéticos e o colapso de modelos no ecossistema de IA. Ele trata corpora de dados e modelos de IA como populações interagentes, derivando o número de reprodução básico para analisar a recontaminação.
28