RESEARCH29
GEM: Geometric Entropy Mixing for Optimal LLM Data Curation
arXiv CS.LG·27 de maio de 2026
Este artigo apresenta GEM (Geometric Entropy Mixing), uma nova estrutura para curadoria de dados de LLMs que reformula o problema como uma questão variacional numa hipersfera. O GEM otimiza a composição dos dados para treinamento de LLMs, superando falhas de categorização e revelando estruturas semânticas equilibradas.
Ler original ↗