← heapsort-ai

Continual Learning

20 items

RESEARCH↑ trendingReddit r/MachineLearning·hace 27d

Learning, Fast and Slow: Towards LLMs That Adapt Continually [R]

Los grandes modelos de lenguaje (LLM) enfrentan el olvido catastrófico y la pérdida de plasticidad al actualizar sus parámetros para tareas específicas. Este trabajo introduce un marco de aprendizaje "rápido-lento" para LLM, utilizando los parámetros del modelo como pesos lentos y el contexto optimizado como pesos rápidos para adaptarse eficientemente sin comprometer el razonamiento general.

42
RESEARCHarXiv CS.AI·17/4/2026

Mistake gating leads to energy and memory efficient continual learning

Este estudio introduce el 'aprendizaje con compuerta de errores memorizados', una regla de plasticidad biológicamente plausible que actualiza las sinapsis solo ante errores de clasificación. Esto reduce las actualizaciones de la red entre un 50% y un 80%, mejorando la eficiencia energética y de memoria en escenarios de aprendizaje continuo y en línea.

35
RESEARCHarXiv CS.LG·16/4/2026

Adaptive Memory Crystallization for Autonomous AI Agent Learning in Dynamic Environments

Esta investigación presenta la Cristalización Adaptativa de Memoria (AMC), una nueva arquitectura de memoria para que agentes de IA autónomos consoliden experiencias en entornos dinámicos sin olvidar conocimientos previos. AMC modela la memoria como un proceso continuo de cristalización a través de una jerarquía de tres fases, inspirada en la teoría de etiquetado sináptico y captura.

29
RESEARCHarXiv CS.AI·14/4/2026

AHC: Meta-Learned Adaptive Compression for Continual Object Detection on Memory-Constrained Microcontrollers

AHC es un marco de metaaprendizaje para la detección continua de objetos en microcontroladores con memoria limitada, adaptándose a distribuciones de tareas en evolución. Utiliza compresión adaptativa basada en MAML, compresión jerárquica multiescala y una arquitectura de doble memoria para evitar el olvido catastrófico con un presupuesto de 100KB.

28
RESEARCHarXiv CS.LG·hace 6d

Position: Deployed Reinforcement Learning should be Continual

Este artículo de posición argumenta que los agentes de Aprendizaje por Refuerzo (RL) desplegados deberían participar en un aprendizaje continuo en lugar de un paradigma de entrenar y luego corregir. Identifica cuatro fuentes de no estacionariedad después del despliegue, resaltando la necesidad de que los agentes se adapten continuamente para lograr un rendimiento óptimo en escenarios del mundo real.

28
RESEARCHarXiv CS.CL·20/4/2026

Why Fine-Tuning Encourages Hallucinations and How to Fix It

Los grandes modelos de lenguaje a menudo alucinan hechos, un problema exacerbado por el ajuste fino supervisado (SFT) que degrada el conocimiento preentrenado. Esta investigación propone un método SFT basado en autodestilación, inspirado en el aprendizaje continuo, para mitigar las alucinaciones regulando la deriva de la distribución de salida, mientras adquiere efectivamente nueva información fáctica.

27
ARTICLEDEV.to AI·hace 24d

Meta-Optimized Continual Adaptation for heritage language revitalization programs under multi-jurisdictional compliance

El autor se dio cuenta de la necesidad crítica de la IA en la preservación de lenguas en peligro, enfrentando desafíos como el olvido catastrófico en sistemas de traducción neuronal y complejas leyes de soberanía de datos de múltiples jurisdicciones. El trabajo se centra en la adaptación continua meta-optimizada para programas de revitalización de lenguas patrimoniales.

27
RESEARCHDEV.to AI·21/4/2026

Continual Learning via Neural Pruning

Este contenido probablemente explora el concepto de aprendizaje continuo, un desafío clave en la IA, utilizando técnicas de poda neuronal. Su objetivo es demostrar cómo la poda puede permitir que los modelos adquieran nuevos conocimientos de forma secuencial sin olvidar la información aprendida previamente.

27
RESEARCHarXiv CS.LG·1/5/2026

When Continual Learning Moves to Memory: A Study of Experience Reuse in LLM Agents

Este estudio examina la memoria externa en agentes LLM para el aprendizaje continuo, demostrando que el desafío estabilidad-plasticidad se traslada al nivel de la memoria bajo ventanas de contexto limitadas. Se introduce un marco (k,v) para analizar la representación y organización de la experiencia, hallando que las memorias procedimentales abstractas se transfieren más confiablemente y que una organización de memoria más fina es beneficiosa.

27
RESEARCHarXiv CS.LG·7/5/2026

Continual Distillation of Teachers from Different Domains

Esta investigación introduce la Destilación Continua (CD), un nuevo paradigma donde un modelo estudiante aprende secuencialmente de un flujo de modelos maestros sin retener acceso a los anteriores. Aborda desafíos como la transferencia (UKT) y el olvido (UKF) de conocimiento no visto a través de la Destilación de Datos Externos Propios (SE2D), que utiliza datos externos sin etiquetar para estabilizar el aprendizaje entre maestros heterogéneos.

27
RESEARCHarXiv CS.AI·11/5/2026

CASCADE: Case-Based Continual Adaptation for Large Language Models During Deployment

Este artículo formaliza el Aprendizaje en Tiempo de Despliegue (DTL) como una nueva etapa para los LLM, permitiéndoles adaptarse continuamente a partir de la experiencia posterior al entrenamiento sin modificar los parámetros del modelo. Presenta CASCADE, un marco que equipa a los agentes LLM con una memoria episódica explícita y evolutiva, formalizando la reutilización de la experiencia como un problema de bandido contextual.

27
RESEARCHarXiv CS.LG·hace 13d

Architecture-driven Shift: towards a lightweight selector for capturing the trends of logit shift

Este artículo propone un nuevo selector ligero para capturar las tendencias de 'logit shift' en el Aprendizaje Continuo (CL), un desafío computacionalmente costoso en la selección de modelos pre-entrenados. La investigación aborda la heterogeneidad arquitectónica de las redes neuronales, desacoplando la dependencia de la arquitectura y los datos para establecer un nuevo marco teórico.

27
RESEARCHarXiv CS.CL·6/4/2026

Revealing the Learning Dynamics of Long-Context Continual Pre-training

Este artigo investiga sistematicamente as dinâmicas de aprendizado do Pré-treinamento Contínuo de Contexto Longo (LCCP) usando o modelo industrial Hunyuan-A13B, rastreando sua evolução por 200 bilhões de tokens. Ele propõe uma estrutura hierárquica para analisar o LCCP em níveis comportamental, probabilístico e mecanicista, abordando as limitações das metodologias atuais de avaliação e pré-treinamento.

27
ARTICLELangChain Blog·5/4/2026

Continual learning for AI agents

Este contenido aborda el aprendizaje continuo para agentes de IA, proponiendo que el aprendizaje va más allá de la actualización de los pesos del modelo. Introduce tres capas distintas donde el aprendizaje puede ocurrir – el modelo, el arnés y el contexto – destacando cómo esta perspectiva cambia el enfoque para construir sistemas de IA que mejoran con el tiempo.

Continual learning for AI agents
26