RESEARCHarXiv CS.LG·1h atrás
Fidelity, Diversity, and Privacy: A Multi-Dimensional LLM Evaluation for Clinical Data Augmentation
Esta pesquisa propõe o uso de LLMs (DeepSeek-R1, OpenBioLLM-Llama3, Qwen 3.5) para aumentar dados sintéticos de saúde mental, abordando a escassez e regulamentações de privacidade. Um framework de avaliação abrangente é introduzido, examinando fidelidade semântica, diversidade lexical e privacidade/plágio para mitigar riscos como colapso de modo ou memorização.
synthetic dataLLMssecuritydata augmentation