RESEARCH29
NumLeak: Public Numeric Benchmarks as Latent Labels in Foundation Models
arXiv CS.LG·1 de junho de 2026
Este artigo apresenta o NumLeak, uma estrutura para medir a recuperação de informações memorizadas por modelos de fundação a partir de benchmarks numéricos públicos. Ele revela que LLMs de ponta recordam dados financeiros e econômicos com alta fidelidade, sugerindo que as avaliações podem estar medindo a memorização em vez de habilidades genuínas.
Ler original ↗