heapsort
RESEARCH27

SLAP: Stratified Loss-based Pruning for On-Policy Data-Efficient Instruction Tuning

arXiv CS.CL·26 de mayo de 2026

Esta investigación introduce SLAP, un novedoso marco de selección de datos consciente de lotes diseñado para mejorar la eficiencia de datos en el ajuste de instrucciones para LLMs. SLAP optimiza el aprendizaje evaluando composiciones de lotes completas, asegurando una cobertura integral de la distribución de datos y maximizando la diversidad dentro del lote para lograr un rendimiento sin pérdidas con costos de entrenamiento reducidos.

Leer original