heapsort
RESEARCH29

NumLeak: Public Numeric Benchmarks as Latent Labels in Foundation Models

arXiv CS.LG·1 de junio de 2026

Este artículo presenta NumLeak, un marco para medir la recuperación memorizada en modelos fundacionales utilizando benchmarks numéricos públicos. Revela que los LLMs de primer nivel recuerdan datos financieros y económicos con alta fidelidad, sugiriendo que las evaluaciones pueden estar midiendo la memorización en lugar de la habilidad fuera de muestra.

Leer original