RESEARCHarXiv CS.LG·13d atrás
GEM: Geometric Entropy Mixing for Optimal LLM Data Curation
Este artigo apresenta GEM (Geometric Entropy Mixing), uma nova estrutura para curadoria de dados de LLMs que reformula o problema como uma questão variacional numa hipersfera. O GEM otimiza a composição dos dados para treinamento de LLMs, superando falhas de categorização e revelando estruturas semânticas equilibradas.
29