← heapsort-ai

LLM memorization

1 items

RESEARCHarXiv CS.LG·8d atrás

NumLeak: Public Numeric Benchmarks as Latent Labels in Foundation Models

Este artigo apresenta o NumLeak, uma estrutura para medir a recuperação de informações memorizadas por modelos de fundação a partir de benchmarks numéricos públicos. Ele revela que LLMs de ponta recordam dados financeiros e econômicos com alta fidelidade, sugerindo que as avaliações podem estar medindo a memorização em vez de habilidades genuínas.

29