RESEARCH35
Human-like Working Memory Interference in Large Language Models
arXiv CS.LG·14 de abril de 2026
Este estudio examina las limitaciones de la memoria de trabajo en los Large Language Models (LLMs), revelando patrones de interferencia similares a los humanos. Los LLMs preentrenados muestran una degradación del rendimiento con la carga de memoria y un sesgo por recencia, a pesar de que los transformadores pueden ser entrenados para resolver estas tareas perfectamente.
Leer original ↗