← heapsort-ai

clinical decision support

3 items

RESEARCHarXiv CS.AI·il y a 8j

EHRBench: An Automated and Reliable EHR-based Benchmark for Clinical Decision Making with LLMs

Cet article présente EHRBench, un benchmark automatisé et fiable basé sur les dossiers de santé électroniques (DSE) pour évaluer les LLM dans la prise de décision clinique, comblant le manque de compréhension de leur fiabilité dans des tâches cliniques réelles. Il vise à garantir à la fois l'échelle et la qualité dans l'évaluation des modèles de prise de décision clinique (CDM).

28
RESEARCHarXiv CS.CL·il y a 20j

Prompting language influences diagnostic reasoning and accuracy of large language models

Cette recherche a évalué l'impact de la langue d'invite sur le raisonnement diagnostique et la précision des grands modèles linguistiques (LLM) dans des contextes cliniques. Quatre des cinq modèles ont montré de meilleures performances en anglais, soulignant l'incertitude quant à la fiabilité des LLM dans d'autres langues.

27
RESEARCHHugging Face Blog·09/05/2026

"OncoAgent: A Dual-Tier Multi-Agent Framework for Privacy-Preserving Oncology Clinical Decision Support"

Cet article propose OncoAgent, un cadre multi-agent à deux niveaux pour le soutien à la décision clinique en oncologie, axé sur la préservation de la vie privée. Le système vise à améliorer le diagnostic et le traitement du cancer tout en maintenant la confidentialité des données des patients.

27