heapsort
RESEARCH27

SLAP: Stratified Loss-based Pruning for On-Policy Data-Efficient Instruction Tuning

arXiv CS.CL·26. Mai 2026

Diese Forschung stellt SLAP vor, ein neuartiges batch-bewusstes Daten-Auswahl-Framework, das darauf abzielt, die Dateneffizienz beim Instruction Tuning für LLMs zu verbessern. SLAP optimiert das Lernen durch die Bewertung ganzer Batch-Kompositionen, gewährleistet eine umfassende Abdeckung der Datenverteilung und maximiert die Intra-Batch-Diversität, um verlustfreie Leistung bei reduzierten Trainingskosten zu erzielen.

Original lesen