heapsort
RESEARCH27

Self-Prompting Small Language Models for Privacy-Sensitive Clinical Information Extraction

arXiv CS.CL·7. Mai 2026

Diese Forschung stellt ein lokal einsetzbares Framework vor, das kleinen Sprachmodellen ermöglicht, datenschutzrelevante klinische Entitäten aus unstrukturierten zahnmedizinischen Notizen mittels selbstgenerierter und verfeinerter Prompts zu extrahieren. Die Studie evaluierte Open-Weight-Modelle und erzielte hohe F1-Scores mit Qwen2.5-14B-Instruct und Llama-3.1-8B-Instruct nach überwachtem Fine-Tuning und direkter Präferenzoptimierung.

Original lesen