← heapsort-ai

Clinical Communication

1 items

RESEARCHarXiv CS.CL·14/04/2026

Generating High Quality Synthetic Data for Dutch Medical Conversations

Cet article présente un pipeline pour générer des dialogues médicaux synthétiques en néerlandais, utilisant un grand modèle linguistique (LLM) affiné pour pallier la rareté des données cliniques due aux contraintes de confidentialité. Les évaluations ont montré une forte variété lexicale mais un flux de conversation scénarisé et des problèmes de spécificité du domaine lors de l'examen qualitatif.

28