← heapsort-ai

healthcare AI

72 items

ARTICLEDEV.to AI·vor 6Std

How accurate are AI transcripts for technical or medical terms?

Dieser Artikel erörtert das kritische Problem der Ungenauigkeit von KI-Transkriptionen bei technischen und domänenspezifischen Begriffen, anhand eines medizinischen Fehlerbeispiels, bei dem ein Transkriptionsfehler zu einer gefährlichen Medikamentenverwechslung führte. Er betont, wie solche Fehler, die nicht auf das Gesundheitswesen beschränkt sind, nützliche KI-Tools in Haftungsrisiken verwandeln können und erklärt, warum spezialisierte Begriffe für Sprach-zu-Text-Modelle schwierig sind.

62
RESEARCHarXiv CS.LG·vor 19Std

MedicalRec: Medical recommender system for image classification without retraining

Diese Studie stellt MedicalRec vor, ein medizinisches Empfehlungssystem für die Bildklassifikation, das darauf abzielt, die Modellauswahl ohne erneutes Training zu optimieren. Es begegnet den Rechen- und Energieproblemen bei der Modellidentifikation durch einen öffentlich verfügbaren Datensatz, MedicalRec-Bench, der aus 3.000 Artikeln und über 5.000 getesteten Modellaufzeichnungen besteht.

54
RESEARCHarXiv CS.AI·vor 19Std

Reconstructing and forecasting disease trajectories of patients with Alzheimer's disease using routine data in resource-constrained settings

Diese Forschung zielt darauf ab, Krankheitsverläufe von Alzheimer-Patienten mithilfe von Routinedaten in ressourcenbeschränkten Umgebungen zu rekonstruieren und vorherzusagen. Es wird ein einheitliches Framework für die bidirektionale Vorhersage kognitiver Scores aus unregelmäßigen Besuchen vorgeschlagen, das Interpolation und Extrapolation ermöglicht und kalibrierte Unsicherheitsschätzungen liefert.

54
RESEARCHarXiv CS.CL·vor 4T

Improving Heart-Focused Medical Question Answering in LLMs via Variance-Aware Rubric Rewards with GRPO

Diese Forschung untersucht die Verbesserung der herzfokussierten medizinischen Fragenbeantwortung in großen Sprachmodellen (LLMs) mithilfe der Gruppenrelativen Richtlinienoptimierung (GRPO) für das Nachtraining. Es wird ein Varianzbewusster Belohnungsrahmen vorgeschlagen, der die rubrikbasierte Überwachung mit kontinuierlichen analytischen Belohnungsfunktionen verbessert.

30
RESEARCHDEV.to AI·4/8/2026

QIS Protocol vs Federated Learning: A Distributed Health Data Routing Alternative

O texto apresenta o QIS Protocol como uma alternativa ao Federated Learning para o roteamento de dados de saúde distribuídos, superando suas limitações como vazamento de gradientes e dependência de um agregador central. O QIS oferece privacidade por arquitetura, roteando resultados em vez de parâmetros de modelo com custo logarítmico para aplicações clínicas e de saúde populacional.

30
ARTICLEDEV.to AI·4/12/2026

EU AI Act High-Risk Healthcare AI: Why Centralized Architectures Have a Structural Compliance Problem

Dieser Inhalt behandelt ein strukturelles Compliance-Problem zentralisierter KI-Architekturen im Gesundheitswesen, die vom EU-KI-Gesetz als Hochrisiko eingestuft werden. Es verdeutlicht die Schwierigkeit dieser Architekturen, Anforderungen wie Erklärbarkeit und kontinuierliche Risikoüberwachung zu erfüllen, was eine erhebliche Herausforderung für Systeme mit einer Umsetzungsfrist im August 2024 darstellt.

30
ARTICLEDEV.to AI·4/12/2026

QIS (Quadratic Intelligence Swarm) vs HPE Swarm Learning: Why Routing Outcomes Beats Routing Gradients

Dieser Inhalt thematisiert die Herausforderung der KI in der Zusammenarbeit zwischen Krankenhäusern aufgrund von Datenbeschränkungen und vergleicht zwei Föderationsarchitekturen: HPE Swarm Learning und QIS. Der Kernunterschied liegt in der Verteilung von Modelltraining versus validierten Erkenntnissen, mit klaren Implikationen für Anwendungsfälle.

29
CASEDEV.to AI·4/21/2026

Product Case Study- III Incomplete requirements aren’t the exception—they’re the baseline.

Ein KI-Produkt für das Gesundheitswesen (Mammographie-Annotationstool) scheiterte trotz technischer Korrektheit bei der Einführung, da es nicht mit den etablierten Arbeitsabläufen und Interaktionsmustern der Radiologen übereinstimmte. Dies unterstreicht die Notwendigkeit, Anforderungen anhand realer Nutzungsmuster zu validieren, Arbeitsabläufe abzubilden und die Akzeptanz als Produktmetrik zu behandeln.

29
RESEARCHarXiv CS.LG·4/22/2026

Handling and Interpreting Missing Modalities in Patient Clinical Trajectories via Autoregressive Sequence Modeling

Diese Arbeit befasst sich mit der Herausforderung fehlender Modalitäten in multimodalen klinischen Daten für die Diagnose, indem sie dies als autoregressive Sequenzmodellierungsaufgabe neu formuliert. Sie nutzt kausale Decoder von LLMs und ein fehlendes-sensitives kontrastives Vor-Training, um Baselines bei Benchmarks wie MIMIC-IV und eICU zu übertreffen.

29
RESEARCHarXiv CS.AI·vor 8T

EHRBench: An Automated and Reliable EHR-based Benchmark for Clinical Decision Making with LLMs

Die Arbeit stellt EHRBench vor, einen automatisierten und zuverlässigen, EHR-basierten Benchmark zur Bewertung von LLM-basierten klinischen Entscheidungsfindungen, der das unzureichende Verständnis der Zuverlässigkeit von LLMs bei realen klinischen Aufgaben adressiert. Ziel ist es, sowohl Umfang als auch Qualität bei der Bewertung von CDM-Modellen sicherzustellen.

28
ARTICLEDEV.to AI·4/12/2026

QIS Protocol vs Matchmaker Exchange: Two Architectures for Cross-Institutional Rare Disease Intelligence

Der Text thematisiert die architektonische Herausforderung im Bereich seltener Krankheiten, wo weltweit isolierte Patientendaten effektive Diagnosen und Behandlungen behindern. Der Matchmaker Exchange (MME) findet zwar ähnliche Phänotypen, ist aber bei der Behandlungsführung begrenzt, was ein umfassenderes, institutionsübergreifendes Intelligenzsystem erfordert.

28
DOCDEV.to AI·vor 6T

Building HealthcareAI with Safe MCP Tooling

Dieser Inhalt skizziert eine Architektur für die sichere Bereitstellung von KI-Agenten im Gesundheitswesen durch die Implementierung eines berechtigten MCP-Tools (Managed Capability Platform). Diese MCP-Schicht fungiert als kritische Kontrollgrenze, die jeglichen KI-Zugriff auf interne Systeme vermittelt und Interaktionen auf Basis strenger Sicherheitskriterien validiert.

28
RESEARCHarXiv CS.LG·vor 22T

MuteBench: Modality Unavailability Tolerance Evaluation for Incomplete Multimodal Fusion

MuteBench ist ein neuer Benchmark zur Bewertung multimodaler Fusionsarchitekturen in klinischen KI-Systemen, der speziell Sensorausfälle und daraus resultierende fehlende Daten berücksichtigt. Er umfasst diverse Datensätze, Fusionsarchitekturen und zwei Modi fehlender Daten und zeigt, dass die Architekturfamilie der stärkste Prädiktor für Robustheit ist.

28