Instruction Tuning — artículos, noticias e investigación de IA

RESEARCHarXiv CS.CL·hace 15d

SLAP: Stratified Loss-based Pruning for On-Policy Data-Efficient Instruction Tuning

Esta investigación introduce SLAP, un novedoso marco de selección de datos consciente de lotes diseñado para mejorar la eficiencia de datos en el ajuste de instrucciones para LLMs. SLAP optimiza el aprendizaje evaluando composiciones de lotes completas, asegurando una cobertura integral de la distribución de datos y maximizando la diversidad dentro del lote para lograr un rendimiento sin pérdidas con costos de entrenamiento reducidos.

Instruction Tuning LLMs machine learning model optimization