← heapsort-ai

clinical decision support

3 items

RESEARCHarXiv CS.AI·vor 8T

EHRBench: An Automated and Reliable EHR-based Benchmark for Clinical Decision Making with LLMs

Die Arbeit stellt EHRBench vor, einen automatisierten und zuverlässigen, EHR-basierten Benchmark zur Bewertung von LLM-basierten klinischen Entscheidungsfindungen, der das unzureichende Verständnis der Zuverlässigkeit von LLMs bei realen klinischen Aufgaben adressiert. Ziel ist es, sowohl Umfang als auch Qualität bei der Bewertung von CDM-Modellen sicherzustellen.

28
RESEARCHarXiv CS.CL·vor 20T

Prompting language influences diagnostic reasoning and accuracy of large language models

Diese Forschung bewertete den Einfluss der Prompt-Sprache auf die diagnostische Argumentation und Genauigkeit großer Sprachmodelle (LLMs) im klinischen Umfeld. Vier von fünf Modellen zeigten eine bessere Leistung auf Englisch, was die Unsicherheit hinsichtlich der Zuverlässigkeit von LLMs in anderen Sprachen hervorhebt.

27
RESEARCHHugging Face Blog·5/9/2026

"OncoAgent: A Dual-Tier Multi-Agent Framework for Privacy-Preserving Oncology Clinical Decision Support"

Diese Arbeit stellt OncoAgent vor, ein zweistufiges Multi-Agenten-Framework für den datenschutzfreundlichen klinischen Entscheidungsunterstützung in der Onkologie. Das System zielt darauf ab, die Krebsdiagnose und -behandlung zu verbessern, während die Vertraulichkeit der Patientendaten gewahrt bleibt.

27