RESEARCHarXiv CS.LG·hace 13d
GEM: Geometric Entropy Mixing for Optimal LLM Data Curation
Este artículo introduce GEM (Geometric Entropy Mixing), un nuevo marco para la curación de datos de LLM que reformula el problema como uno variacional en la hiperesfera. GEM optimiza la composición de datos para el preentrenamiento de LLMs, superando fallos de categorización y descubriendo estructuras semánticas equilibradas.
29