RESEARCH27

SLAP: Stratified Loss-based Pruning for On-Policy Data-Efficient Instruction Tuning

arXiv CS.CL·26. Mai 2026

Diese Forschung stellt SLAP vor, ein neuartiges batch-bewusstes Daten-Auswahl-Framework, das darauf abzielt, die Dateneffizienz beim Instruction Tuning für LLMs zu verbessern. SLAP optimiert das Lernen durch die Bewertung ganzer Batch-Kompositionen, gewährleistet eine umfassende Abdeckung der Datenverteilung und maximiert die Intra-Batch-Diversität, um verlustfreie Leistung bei reduzierten Trainingskosten zu erzielen.

Instruction Tuning LLMs machine learning model optimization Data Pruning

Original lesen ↗