← heapsort-ai

model collapse

4 items

RESEARCHarXiv CS.CL·hace 4d

Epidemiology of Model Collapse: Modeling Synthetic Data Contamination via Bilayer SIR Dynamics

El artículo propone un marco SIR/SIRS bicapa para modelar la contaminación de datos sintéticos y el colapso de modelos en el ecosistema de IA. Este modelo fenomenológico de campo medio trata los corpus de datos y los modelos de IA como poblaciones interactuantes, derivando un número de reproducción básico para analizar la contaminación cruzada.

28
RESEARCHarXiv CS.CL·1/5/2026

Exploring the Limits of Pruning: Task-Specific Neurons, Model Collapse, and Recovery in Task-Specific Large Language Models

Este estudio explora la existencia de neuronas específicas para tareas en grandes modelos de lenguaje, centrándose en el razonamiento matemático y la generación de código. Introduce una métrica de selectividad basada en activación para la poda de neuronas, que supera consistentemente la poda aleatoria en la reducción del costo computacional y el mantenimiento de la precisión de la tarea, previniendo el colapso del rendimiento.

27