RESEARCH27
Always Learning, Always Mixing: Efficient and Simple Data Mixing All The Time
arXiv CS.CL·18 de maio de 2026
Esta pesquisa apresenta o OP-Mix, um algoritmo inovador para a mistura eficiente de dados ao longo de todo o ciclo de vida do treinamento de modelos de linguagem. Ele aborda o desafio de combinar diversas fontes de dados para pré-treinamento, aprendizado contínuo e adaptação, propondo uma solução unificada de tomada de decisão online.
Ler original ↗