heapsort
RESEARCH27

Fidelity, Diversity, and Privacy: A Multi-Dimensional LLM Evaluation for Clinical Data Augmentation

arXiv CS.LG·1 mai 2026

Cette recherche propose l'utilisation de LLM (DeepSeek-R1, OpenBioLLM-Llama3, Qwen 3.5) pour l'augmentation de données synthétiques en santé mentale, répondant à la pénurie et aux réglementations de confidentialité. Un cadre d'évaluation complet est introduit, évaluant la fidélité sémantique, la diversité lexicale et la confidentialité/plagiat pour atténuer les risques comme l'effondrement de mode ou la mémorisation.

Lire l'original