heapsort
RESEARCH29

GEM: Geometric Entropy Mixing for Optimal LLM Data Curation

arXiv CS.LG·27 de maio de 2026

Este artigo apresenta GEM (Geometric Entropy Mixing), uma nova estrutura para curadoria de dados de LLMs que reformula o problema como uma questão variacional numa hipersfera. O GEM otimiza a composição dos dados para treinamento de LLMs, superando falhas de categorização e revelando estruturas semânticas equilibradas.

Ler original