heapsort
RESEARCH27

Always Learning, Always Mixing: Efficient and Simple Data Mixing All The Time

arXiv CS.CL·18 mai 2026

Cette recherche présente OP-Mix, un nouvel algorithme pour le mélange efficace de données tout au long du cycle de vie de l'entraînement des modèles de langage. Il aborde le défi de combiner diverses sources de données pour le pré-entraînement, l'apprentissage continu et l'adaptation, proposant une solution unifiée de prise de décision en ligne.

Lire l'original