← heapsort-ai

data mixing

1 items

RESEARCHarXiv CS.CL·vor 22T

Always Learning, Always Mixing: Efficient and Simple Data Mixing All The Time

Diese Forschung stellt OP-Mix vor, einen neuartigen Algorithmus zur effizienten Datenmischung über den gesamten Lebenszyklus des Sprachmodelltrainings. Er adressiert die Herausforderung der Kombination verschiedener Datenquellen für Vortraining, kontinuierliches Lernen und Anpassung und schlägt eine einheitliche Online-Entscheidungslösung vor.

27