RESEARCH↑ trendingReddit r/MachineLearning·27d atrás
Continual Harness: Online Adaptation for Self-Improving Foundation Agents [R]
O artigo apresenta o "Continual Harness", uma nova abordagem para a adaptação online de agentes de fundação auto-aprimoráveis, formalizando o ciclo de refinamento iterativo. Essa metodologia permite a co-aprendizagem entre o modelo e o "harness", inspirando-se no sucesso de sistemas como o Gemini Plays Pokémon.
![Continual Harness: Online Adaptation for Self-Improving Foundation Agents [R]](/cdn-cgi/image/width=3840,quality=75,format=webp/https://preview.redd.it/p9cd2zmfy01h1.png?width=140&height=56&auto=webp&s=fd1f3545b0efc0e42e9d014caa1aa2f83f0f409a)
42