RESEARCHarXiv CS.CL·15d atrás
SLAP: Stratified Loss-based Pruning for On-Policy Data-Efficient Instruction Tuning
Esta pesquisa apresenta SLAP, um novo framework de seleção de dados sensível a lotes, projetado para melhorar a eficiência de dados no ajuste de instruções para LLMs. O SLAP otimiza o aprendizado avaliando composições de lotes inteiros, garantindo uma cobertura abrangente da distribuição de dados e maximizando a diversidade intra-lote para alcançar desempenho sem perdas com custos de treinamento reduzidos.
27