← heapsort-ai

medical AI

34 items

RESEARCHarXiv CS.AI·hace 20h

PathoSage: Towards Multi-Source Evidence Adjudication in Pathology via Experience-Aware Agentic Workflow

PathoSage es un marco de tres etapas que aborda la adjudicación de evidencia en patología, separando explícitamente la recuperación de conocimiento, la recopilación y la adjudicación de evidencia. Utiliza un sistema agéntico con Deliberación Estructurada de Evidencia para evaluar de forma independiente la evidencia heterogénea y reducir el sesgo de anclaje.

54
RESEARCHarXiv CS.LG·hace 17d

HealthCraft: A Reinforcement Learning Safety Environment for Emergency Medicine

El artículo presenta HealthCraft, un entorno público de aprendizaje por refuerzo para evaluar la seguridad de los modelos de lenguaje de frontera en medicina de emergencia. Se centra en la seguridad a nivel de trayectoria, el uso indebido de herramientas y la presión clínica, construido sobre un estado mundial FHIR R4 y ofreciendo 195 tareas para una evaluación exhaustiva.

29
RESEARCHarXiv CS.LG·hace 27d

Interpretable EEG Microstate Discovery via Variational Deep Embedding: A Systematic Architecture Search with Multi-Quadrant Evaluation

Este artículo presenta el modelo Convolutional Variational Deep Embedding (Conv-VaDE) para el análisis de microestados EEG. Mejora la interpretabilidad al aprender conjuntamente la reconstrucción topográfica y la agrupación probabilística suave, permitiendo la decodificación generativa de prototipos de clústeres en topografías verificables.

29
ARTICLEMIT Tech Review AI·4/5/2026

Tailoring AI solutions for health care needs

El mercado de la IA promete grandes transformaciones, siendo la atención médica un objetivo principal debido a las presiones financieras, la escasez de mano de obra y la creciente carga de cuidar a una población envejecida. Los desarrolladores de IA se centran en funciones variadas, desde curar el cáncer hasta optimizar procesos.

28
ARTICLEDEV.to AI·hace 25d

Why AI for Doctors Is Becoming Essential in Modern Medicine

El 94% de los ejecutivos de salud consideran la IA crítica para el futuro de la medicina. La inteligencia artificial asiste a los médicos escaneando imágenes de radiología e identificando cánceres de piel o células cancerosas con rapidez y precisión. Sirve como una poderosa segunda opinión, combinando su velocidad con el juicio humano y el contexto del paciente.

28
RESEARCHarXiv CS.LG·7/5/2026

Investigating Trustworthiness of Nonparametric Deep Survival Models for Alzheimer's Disease Progression Analysis

Esta investigación explora la fiabilidad y la equidad de los modelos de supervivencia profunda no paramétricos para analizar la progresión de la Enfermedad de Alzheimer (EA). Aborda la falta de estudios que consideren el sesgo aprendido en los modelos de aprendizaje profundo existentes para la EA y propone nuevas métricas de equidad para garantizar predicciones confiables.

28
RESEARCHarXiv CS.CL·hace 27d

ClinicalBench: Stress-Testing Assertion-Aware Retrieval for Cross-Admission Clinical QA on MIMIC-IV

El artículo presenta ClinicalBench, un nuevo benchmark de 400 preguntas para evaluar la recuperación sensible a afirmaciones en la respuesta a preguntas clínicas en MIMIC-IV usando notas de historias clínicas electrónicas reales. También describe EpiKG, un sistema de grafo de conocimiento del paciente que mejora la recuperación al considerar la negación y la temporalidad, mostrando una mejora significativa en el rendimiento de los LLMs clínicos.

28
RESEARCHarXiv CS.LG·15/4/2026

DBGL: Decay-aware Bipartite Graph Learning for Irregular Medical Time Series Classification

DBGL introduce un novedoso método de Aprendizaje de Grafos Bipartitos con Conciencia de Decaimiento para la clasificación de series temporales médicas irregulares. Emplea un grafo bipartito paciente-variable para capturar patrones de muestreo irregulares y relaciones entre variables, junto con una codificación de decaimiento temporal específica de nodo para la irregularidad de decaimiento de las variables.

28
ARTICLEDEV.to AI·17/4/2026

We Built a Medical AI With 383 Specialist Agents. Here's What Actually Works (and What Doesn't)

El artículo comparte aprendizajes de 18 meses construyendo Helios Med, una IA médica con 383 agentes especialistas diseñada para apoyar el razonamiento diagnóstico. Busca ofrecer una segunda opinión exhaustiva a médicos y pacientes, abordando las limitaciones del sistema de salud actual y los errores de diagnóstico.

28
RESEARCHarXiv CS.CL·hace 18d

When Cases Get Rare: A Retrieval Benchmark for Off-Guideline Clinical Question Answering

Este artículo presenta OGCaReBench, un nuevo benchmark centrado en la recuperación para evaluar la capacidad de los LLMs de responder a preguntas clínicas que van más allá de las pautas médicas típicas. Aborda la brecha de que la mayoría de los LLMs médicos están entrenados en conocimientos comunes y centrados en pautas, mientras que la práctica real a menudo implica casos raros no cubiertos por estas.

28
RESEARCHarXiv CS.AI·hace 6d

Traj-Evolve: A Self-Evolving Multi-Agent System for Patient Trajectory Modeling in Lung Cancer Early Detection

Traj-Evolve es un sistema multiagente autoevolutivo para modelar trayectorias de pacientes a partir de registros de salud electrónicos, enfocado en la detección temprana del cáncer de pulmón. Emplea un Pool de Experiencia para recuperar casos similares y aprendizaje por refuerzo multiagente para optimizar la colaboración.

28
RESEARCHarXiv CS.AI·17/4/2026

Seeing Through Experts Eyes A Foundational Vision Language Model Trained on Radiologists Gaze and Reasoning

GazeX es un nuevo modelo de lenguaje visual entrenado con datos de seguimiento ocular y razonamiento de radiólogos para mejorar la interpretación de radiografías de tórax. El modelo aprende a emular la atención espacial y temporal experta, con el objetivo de cerrar la brecha entre las salidas del modelo y el razonamiento diagnóstico clínico.

27
RESEARCHarXiv CS.CL·10/4/2026

EMSDialog: Synthetic Multi-person Emergency Medical Service Dialogue Generation from Electronic Patient Care Reports via Multi-LLM Agents

O estudo apresenta o EMSDialog, um novo conjunto de dados de 4.414 conversas sintéticas multi-falantes para serviços médicos de emergência, geradas a partir de relatórios reais de pacientes usando uma pipeline de agentes multi-LLM. Este dataset, anotado com diagnósticos e tópicos, demonstra melhorias na precisão e estabilidade da previsão de diagnóstico conversacional.

27
RESEARCHarXiv CS.LG·1/5/2026

People-Centred Medical Image Analysis

A pesar de los precisos sistemas de diagnóstico de la IA médica centrada en datos, su adopción clínica es limitada por la insuficiente atención a un rendimiento justo en diversas poblaciones de pacientes y a una mala integración en el flujo de trabajo. Este artículo propone un enfoque de 'Análisis de Imágenes Médicas Centrado en las Personas' para abordar estos desafíos interconectados.

27
RESEARCHarXiv CS.CL·hace 20d

Prompting language influences diagnostic reasoning and accuracy of large language models

Esta investigación evaluó el impacto del idioma de las instrucciones en el razonamiento diagnóstico y la precisión de los grandes modelos de lenguaje (LLM) en entornos clínicos. Cuatro de los cinco modelos mostraron un mejor rendimiento en inglés, subrayando la incertidumbre sobre la fiabilidad de los LLM en otros idiomas.

27
ARTICLEDEV.to AI·hace 22d

Medical AI Doesn’t Just Need Bigger Models. It Needs an ImageNet for State Transitions

El artículo propone la creación de un "Biomedical TransitionNet", un nuevo tipo de conjunto de datos análogo a ImageNet, pero centrado en las transiciones de estados biológicos para la próxima generación de IA médica. Argumenta la necesidad de dicha infraestructura para construir modelos del mundo real en biomedicina, yendo más allá de la clasificación y la predicción.

27