Human-like Working Memory Interference in Large Language Models
Este estudio examina las limitaciones de la memoria de trabajo en los Large Language Models (LLMs), revelando patrones de interferencia similares a los humanos. Los LLMs preentrenados muestran una degradación del rendimiento con la carga de memoria y un sesgo por recencia, a pesar de que los transformadores pueden ser entrenados para resolver estas tareas perfectamente.