← heapsort-ai

healthcare AI

72 items

ARTICLEDEV.to AI·13/4/2026

The Shocking Truth About AI Agent Benchmarks: Your Medical Diagnostics Will Never Be the Same in 2026

El artículo revela la importancia crítica de puntos de referencia rigurosos y estandarizados para agentes de IA en diagnósticos médicos para 2026, cuestionando la preparación de la IA para una adopción clínica generalizada. Enfatiza que, sin una validación de rendimiento adecuada, el potencial revolucionario de la IA en la atención médica sigue siendo en gran medida teórico y no confiable.

27
ARTICLEDEV.to AI·hace 16d

I open-sourced a 4-agent blood-panel triage workflow on heym, with a deterministic Python safety gate that runs BEFORE any LLM token

Se desarrolló un flujo de trabajo multiagente de 4 agentes para transformar paneles sanguíneos brutos en informes estructurados de educación del paciente. La arquitectura incluye una puerta de seguridad Python determinista que se ejecuta antes de cualquier token LLM, evitando fallas críticas en valores de laboratorio de emergencia.

27
RESEARCHarXiv CS.AI·15/4/2026

A longitudinal health agent framework

Esta investigación propone un marco multicapa y una arquitectura de agente de IA para apoyar tareas de salud longitudinales, como la gestión de síntomas y el soporte al paciente. Su objetivo es mejorar la adaptación, la coherencia, la continuidad y la autonomía del usuario en interacciones repetidas, abordando las deficiencias de las implementaciones actuales.

27
RESEARCHarXiv CS.LG·15/4/2026

Schema-Adaptive Tabular Representation Learning with LLMs for Generalizable Multimodal Clinical Reasoning

Esta investigación presenta "Schema-Adaptive Tabular Representation Learning", un método novedoso que utiliza Large Language Models (LLMs) para crear embeddings tabulares transferibles. Al transformar variables estructuradas en declaraciones semánticas de lenguaje natural, permite la alineación zero-shot entre esquemas de EHR variables en medicina clínica, sin ingeniería de características manual.

27
RESEARCHarXiv CS.LG·1/5/2026

Fidelity, Diversity, and Privacy: A Multi-Dimensional LLM Evaluation for Clinical Data Augmentation

Esta investigación propone el uso de LLMs (DeepSeek-R1, OpenBioLLM-Llama3, Qwen 3.5) para la aumentación de datos sintéticos de salud mental, abordando la escasez y las regulaciones de privacidad. Se introduce un marco de evaluación integral que examina la fidelidad semántica, la diversidad léxica y la privacidad/plagio para mitigar riesgos como el colapso de modo o la memorización.

27
RESEARCHarXiv CS.CL·16/4/2026

A Proactive EMR Assistant for Doctor-Patient Dialogue: Streaming ASR, Belief Stabilization, and Preliminary Controlled Evaluation

Este artículo presenta un asistente proactivo de EMR para el diálogo médico-paciente, que supera los sistemas pasivos al integrar ASR en streaming, estabilización de creencias y planificación de acciones. El sistema fue evaluado en un entorno controlado preliminar, logrando un F1 de 0.84 y Recall@5 de 0.87.

27
RESEARCHarXiv CS.CL·27/4/2026

Lightweight Retrieval-Augmented Generation and Large Language Model-Based Modeling for Scalable Patient-Trial Matching

Este trabajo presenta un marco ligero para la coincidencia escalable de pacientes con ensayos clínicos, abordando los desafíos de los registros de salud electrónicos largos y complejos. Combina la generación aumentada por recuperación (RAG) para identificar segmentos relevantes de EHR con grandes modelos de lenguaje (LLMs) para codificar estos segmentos en representaciones informativas.

27
RESEARCHarXiv CS.LG·hace 19d

GraphDiffMed: Knowledge-Constrained Differential Attention with Pharmacological Graph Priors for Medication Recommendation

GraphDiffMed es un nuevo marco para la recomendación de combinaciones de medicamentos seguras y efectivas a partir de registros de salud electrónicos. Utiliza atención diferencial de doble escala para filtrar señales espurias e incorpora restricciones farmacológicas durante el aprendizaje, mejorando la calidad de la recomendación.

27
RESEARCHarXiv CS.LG·24/4/2026

Validating a Deep Learning Algorithm to Identify Patients with Glaucoma using Systemic Electronic Health Records

Esta investigación valida un algoritmo de deep learning para la evaluación del riesgo de glaucoma utilizando registros electrónicos de salud sistémicos. El modelo, ajustado con datos de pacientes de Stanford, logró un AUROC de 0.883 y un PPV de 0.657, mostrando un gran potencial para la detección previa escalable y accesible.

27
RESEARCHarXiv CS.AI·7/5/2026

Actionable Real-Time Modeling of Surgical Team Dynamics via Time-Expanded Interaction Graphs

Este artículo propone un enfoque práctico en tiempo real para modelar la dinámica de los equipos quirúrgicos utilizando grafos de interacción expandidos en el tiempo. El modelo permite una inferencia eficiente con una red neuronal de grafos estática, prediciendo la eficiencia del procedimiento y apoyando el análisis contrafactual para identificar cambios en la estructura de comunicación.

27
RESEARCHarXiv CS.LG·hace 22d

Logical Grammar Induction via Graph Kolmogorov Complexity: A Neuro-Symbolic Framework for Self-Healing Clinical Data Integrity

Este artículo introduce Logic-GNN, un marco neuro-simbólico que utiliza Redes Neuronales Gráficas Temporales y la Complejidad de Kolmogorov para detectar errores de entrada de datos en registros clínicos. Identifica anomalías como "violaciones gramaticales" en una gramática lógica latente de interacciones médicas, logrando una puntuación F1 de 0.94.

27
RESEARCHarXiv CS.AI·hace 6d

ChatHealthAI: Aligning Electronic Health Record Representations with Large Language Models for Grounded Clinical Reasoning

ChatHealthAI propone un marco multimodal para alinear representaciones estructuradas de registros de salud electrónicos (EHR) con grandes modelos de lenguaje (LLMs). Esta integración permite un razonamiento clínico basado en lenguaje natural y una predicción precisa del paciente, cerrando la brecha entre los modelos predictivos de EHR y el razonamiento interpretable de LLM.

27
RESEARCHarXiv CS.CL·hace 12d

RAG-Coding: Enhancing LLM Medical Coding with Structured External Knowledge

Este artículo presenta RAG-Coding, un método agéntico que emplea cuatro agentes de LLM para la codificación automatizada ICD-10-CM, basando las decisiones en fuentes de conocimiento externas para mejorar la precisión y el cumplimiento. Supera los modelos de referencia basados en LLM existentes en el conjunto de datos MDACE, destacando la importancia de la integración de conocimiento externo.

27
RESEARCHarXiv CS.CL·hace 13d

The Daily Dose: Workflow-Integrated Large Language Model Automation for Clinical Summarization and Trial Identification in Radiation Oncology

The Daily Dose (TDD) es un sistema impulsado por LLM para la elaboración de resúmenes clínicos y la identificación de ensayos en oncología radioterápica, integrado en la práctica rutinaria. La evaluación clínica temprana reveló una alta satisfacción de los clínicos, utilidad percibida e impacto positivo en el flujo de trabajo y el ahorro de tiempo.

27
CASEDEV.to AI·27/4/2026

We Built a Voice AI Receptionist in 8 Weeks — Every Decision We Made and Why

El equipo de Autor construyó una recepcionista de voz con IA para clínicas de salud en solo 8 semanas, pasando del concepto a un sistema de producción que maneja llamadas de pacientes 24/7. El sistema procesa miles de llamadas mensuales, resolviendo el problema de las llamadas perdidas fuera del horario laboral y liberando tiempo del personal.

27