heapsort
RESEARCH27

MemQ: Integrating Q-Learning into Self-Evolving Memory Agents over Provenance DAGs

arXiv CS.AI·12 de maio de 2026

MemQ integra traços de elegibilidade TD($\lambda$) com Q-valores de memória, propagando crédito através de um DAG de proveniência para contabilizar dependências entre memórias. Esta abordagem melhora significativamente a acumulação e recuperação de experiência por agentes LLM, alcançando altas taxas de sucesso em diversos benchmarks.

Ler original
MemQ: Integrating Q-Learning into Self-Evolving Memory Agents over Provenance DAGs — arXiv CS.AI — heapsort-ai