RESEARCH61

Fidelity, Diversity, and Privacy: A Multi-Dimensional LLM Evaluation for Clinical Data Augmentation

arXiv CS.LG·1 de maio de 2026

Esta pesquisa propõe o uso de LLMs (DeepSeek-R1, OpenBioLLM-Llama3, Qwen 3.5) para aumentar dados sintéticos de saúde mental, abordando a escassez e regulamentações de privacidade. Um framework de avaliação abrangente é introduzido, examinando fidelidade semântica, diversidade lexical e privacidade/plágio para mitigar riscos como colapso de modo ou memorização.

synthetic dataLLMssecuritydata augmentationhealthcare AI

Ler original ↗