Continual Learning

20 items

RESEARCH↑ trendingReddit r/MachineLearning·hace 27d

Learning, Fast and Slow: Towards LLMs That Adapt Continually [R]

Los grandes modelos de lenguaje (LLM) enfrentan el olvido catastrófico y la pérdida de plasticidad al actualizar sus parámetros para tareas específicas. Este trabajo introduce un marco de aprendizaje "rápido-lento" para LLM, utilizando los parámetros del modelo como pesos lentos y el contexto optimizado como pesos rápidos para adaptarse eficientemente sin comprometer el razonamiento general.

LLMs learning Catastrophic Forgetting AI Research

RESEARCHarXiv CS.AI·17/4/2026

Mistake gating leads to energy and memory efficient continual learning

Este estudio introduce el 'aprendizaje con compuerta de errores memorizados', una regla de plasticidad biológicamente plausible que actualiza las sinapsis solo ante errores de clasificación. Esto reduce las actualizaciones de la red entre un 50% y un 80%, mejorando la eficiencia energética y de memoria en escenarios de aprendizaje continuo y en línea.

neural networks efficiency learning algorithms Continual Learning

RESEARCHarXiv CS.LG·16/4/2026

Adaptive Memory Crystallization for Autonomous AI Agent Learning in Dynamic Environments

Esta investigación presenta la Cristalización Adaptativa de Memoria (AMC), una nueva arquitectura de memoria para que agentes de IA autónomos consoliden experiencias en entornos dinámicos sin olvidar conocimientos previos. AMC modela la memoria como un proceso continuo de cristalización a través de una jerarquía de tres fases, inspirada en la teoría de etiquetado sináptico y captura.

reinforcement learning machine learning memory architecture AI agents

RESEARCHarXiv CS.AI·14/4/2026

AHC: Meta-Learned Adaptive Compression for Continual Object Detection on Memory-Constrained Microcontrollers

AHC es un marco de metaaprendizaje para la detección continua de objetos en microcontroladores con memoria limitada, adaptándose a distribuciones de tareas en evolución. Utiliza compresión adaptativa basada en MAML, compresión jerárquica multiescala y una arquitectura de doble memoria para evitar el olvido catastrófico con un presupuesto de 100KB.

Meta-Learning Adaptive Compression Microcontrollers object detection

RESEARCHarXiv CS.LG·hace 6d

Position: Deployed Reinforcement Learning should be Continual

Este artículo de posición argumenta que los agentes de Aprendizaje por Refuerzo (RL) desplegados deberían participar en un aprendizaje continuo en lugar de un paradigma de entrenar y luego corregir. Identifica cuatro fuentes de no estacionariedad después del despliegue, resaltando la necesidad de que los agentes se adapten continuamente para lograr un rendimiento óptimo en escenarios del mundo real.

reinforcement learning learning Adaptive AI AI deployment

RESEARCHarXiv CS.CL·20/4/2026

Why Fine-Tuning Encourages Hallucinations and How to Fix It

Los grandes modelos de lenguaje a menudo alucinan hechos, un problema exacerbado por el ajuste fino supervisado (SFT) que degrada el conocimiento preentrenado. Esta investigación propone un método SFT basado en autodestilación, inspirado en el aprendizaje continuo, para mitigar las alucinaciones regulando la deriva de la distribución de salida, mientras adquiere efectivamente nueva información fáctica.

hallucinations large language models Fine-tuning Continual Learning

ARTICLEDEV.to AI·hace 28d

DeepMind’s CEO Says AGI May Be ~4 Years Away. The Last Three Missing Pieces Are Not What Most People Think.

Demis Hassabis, CEO de Google DeepMind, predice que la AGI podría llegar alrededor de 2030, señalando tres brechas críticas en la IA actual: aprendizaje continuo, razonamiento a largo plazo y memoria real. Describe los modelos actuales como de "inteligencia irregular", con picos de rendimiento junto a fallos elementales.

DeepMind AGI Reasoning AI development

RESEARCHDEV.to AI·26/4/2026

Deep Generative Dual Memory Network for Continual Learning

El título "Deep Generative Dual Memory Network for Continual Learning" describe una arquitectura de red neuronal profunda y generativa. Su objetivo es facilitar el aprendizaje continuo, permitiendo que el modelo adquiera nueva información sin olvidar conocimientos previos, mediante un enfoque de doble memoria.

neural networks deep learning Continual Learning Generative AI

ARTICLEDEV.to AI·hace 24d

Meta-Optimized Continual Adaptation for heritage language revitalization programs under multi-jurisdictional compliance

El autor se dio cuenta de la necesidad crítica de la IA en la preservación de lenguas en peligro, enfrentando desafíos como el olvido catastrófico en sistemas de traducción neuronal y complejas leyes de soberanía de datos de múltiples jurisdicciones. El trabajo se centra en la adaptación continua meta-optimizada para programas de revitalización de lenguas patrimoniales.

data compliance AI indigenous languages language revitalization

RESEARCHDEV.to AI·21/4/2026

Continual Learning via Neural Pruning

Este contenido probablemente explora el concepto de aprendizaje continuo, un desafío clave en la IA, utilizando técnicas de poda neuronal. Su objetivo es demostrar cómo la poda puede permitir que los modelos adquieran nuevos conocimientos de forma secuencial sin olvidar la información aprendida previamente.

neural-pruning machine learning Continual Learning

RESEARCHDEV.to AI·14/4/2026

Don't forget, there is more than forgetting: new metrics for Continual Learning

Este contenido presenta nuevas métricas para el Aprendizaje Continuo, ampliando la evaluación más allá de la prevención del olvido catastrófico. Propone una visión más completa para medir el rendimiento de los modelos de IA en escenarios de aprendizaje secuencial.

AI metrics evaluation machine learning Catastrophic Forgetting

RESEARCHarXiv CS.LG·1/5/2026

NORACL: Neurogenesis for Oracle-free Resource-Adaptive Continual Learning

El artículo propone NORACL, inspirado en la neurogénesis biológica, para abordar el dilema estabilidad-plasticidad en el aprendizaje continuo. Aborda el problema de la arquitectura oráculo, donde las redes finitas tienen recursos limitados para tareas futuras desconocidas.

neural networks machine learning neurogenesis Continual Learning

RESEARCHarXiv CS.LG·1/5/2026

When Continual Learning Moves to Memory: A Study of Experience Reuse in LLM Agents

Este estudio examina la memoria externa en agentes LLM para el aprendizaje continuo, demostrando que el desafío estabilidad-plasticidad se traslada al nivel de la memoria bajo ventanas de contexto limitadas. Se introduce un marco (k,v) para analizar la representación y organización de la experiencia, hallando que las memorias procedimentales abstractas se transfieren más confiablemente y que una organización de memoria más fina es beneficiosa.

research memory AI agents Continual Learning

RESEARCHarXiv CS.LG·hace 20d

CP-MoE: Consistency-Preserving Mixture-of-Experts for Continual Learning

CP-MoE aborda el olvido catastrófico en el aprendizaje continuo para LLMs y VLMs que utilizan arquitecturas Mixture-of-Experts. Introduce un experto transitorio y un enrutamiento que preserva la consistencia para integrar nuevos conocimientos y evitar la sobrescritura de parámetros existentes.

LLMs VLMs learning Mixture of Experts

RESEARCHarXiv CS.LG·7/5/2026

Continual Distillation of Teachers from Different Domains

Esta investigación introduce la Destilación Continua (CD), un nuevo paradigma donde un modelo estudiante aprende secuencialmente de un flujo de modelos maestros sin retener acceso a los anteriores. Aborda desafíos como la transferencia (UKT) y el olvido (UKF) de conocimiento no visto a través de la Destilación de Datos Externos Propios (SE2D), que utiliza datos externos sin etiquetar para estabilizar el aprendizaje entre maestros heterogéneos.

Knowledge Distillation deep learning learning Continual Learning

RESEARCHarXiv CS.AI·11/5/2026

CASCADE: Case-Based Continual Adaptation for Large Language Models During Deployment

Este artículo formaliza el Aprendizaje en Tiempo de Despliegue (DTL) como una nueva etapa para los LLM, permitiéndoles adaptarse continuamente a partir de la experiencia posterior al entrenamiento sin modificar los parámetros del modelo. Presenta CASCADE, un marco que equipa a los agentes LLM con una memoria episódica explícita y evolutiva, formalizando la reutilización de la experiencia como un problema de bandido contextual.

LLMs adaptation machine learning AI deployment

RESEARCHarXiv CS.LG·hace 13d

Architecture-driven Shift: towards a lightweight selector for capturing the trends of logit shift

Este artículo propone un nuevo selector ligero para capturar las tendencias de 'logit shift' en el Aprendizaje Continuo (CL), un desafío computacionalmente costoso en la selección de modelos pre-entrenados. La investigación aborda la heterogeneidad arquitectónica de las redes neuronales, desacoplando la dependencia de la arquitectura y los datos para establecer un nuevo marco teórico.

neural networks model selection learning Logit Shift

RESEARCHarXiv CS.CL·6/4/2026

Revealing the Learning Dynamics of Long-Context Continual Pre-training

Este artigo investiga sistematicamente as dinâmicas de aprendizado do Pré-treinamento Contínuo de Contexto Longo (LCCP) usando o modelo industrial Hunyuan-A13B, rastreando sua evolução por 200 bilhões de tokens. Ele propõe uma estrutura hierárquica para analisar o LCCP em níveis comportamental, probabilístico e mecanicista, abordando as limitações das metodologias atuais de avaliação e pré-treinamento.

Long-Context Continual Pre-training Model Evaluation Pre-training Dynamics large language models

NEWSLangChain Blog·hace 21d

Introducing LangChain Labs

LangChain Labs es una nueva iniciativa de investigación aplicada centrada en el aprendizaje continuo para agentes. Con socios, busca avanzar en la investigación abierta sobre sistemas de IA auto-mejorables.

LangChain self-improving AI AI Research AI agents

ARTICLELangChain Blog·5/4/2026

Continual learning for AI agents

Este contenido aborda el aprendizaje continuo para agentes de IA, proponiendo que el aprendizaje va más allá de la actualización de los pesos del modelo. Introduce tres capas distintas donde el aprendizaje puede ocurrir – el modelo, el arnés y el contexto – destacando cómo esta perspectiva cambia el enfoque para construir sistemas de IA que mejoran con el tiempo.

Model weights AI system design machine learning AI agents