RESEARCH29
NumLeak: Public Numeric Benchmarks as Latent Labels in Foundation Models
arXiv CS.LG·1 de junio de 2026
Este artículo presenta NumLeak, un marco para medir la recuperación memorizada en modelos fundacionales utilizando benchmarks numéricos públicos. Revela que los LLMs de primer nivel recuerdan datos financieros y económicos con alta fidelidad, sugiriendo que las evaluaciones pueden estar midiendo la memorización en lugar de la habilidad fuera de muestra.
Leer original ↗