← heapsort-ai

Instruction Tuning

1 items

RESEARCHarXiv CS.CL·15d atrás

SLAP: Stratified Loss-based Pruning for On-Policy Data-Efficient Instruction Tuning

Esta pesquisa apresenta SLAP, um novo framework de seleção de dados sensível a lotes, projetado para melhorar a eficiência de dados no ajuste de instruções para LLMs. O SLAP otimiza o aprendizado avaliando composições de lotes inteiros, garantindo uma cobertura abrangente da distribuição de dados e maximizando a diversidade intra-lote para alcançar desempenho sem perdas com custos de treinamento reduzidos.

27