medical AI

34 items

RESEARCHarXiv CS.AI·hace 20h

PathoSage: Towards Multi-Source Evidence Adjudication in Pathology via Experience-Aware Agentic Workflow

PathoSage es un marco de tres etapas que aborda la adjudicación de evidencia en patología, separando explícitamente la recuperación de conocimiento, la recopilación y la adjudicación de evidencia. Utiliza un sistema agéntico con Deliberación Estructurada de Evidencia para evaluar de forma independiente la evidencia heterogénea y reducir el sesgo de anclaje.

agent workflows MLLMs pathology medical AI

RESEARCHDEV.to AI·18/4/2026

ChatCAD: Interactive Computer-Aided Diagnosis on Medical Image using LargeLanguage Models

ChatCAD es un sistema interactivo de diagnóstico asistido por computadora que utiliza Grandes Modelos de Lenguaje para analizar imágenes médicas. Busca mejorar la precisión y eficiencia del diagnóstico médico mediante la inteligencia artificial.

computer-aided diagnosis Healthcare large language models Medical Imaging

RESEARCHarXiv CS.CL·hace 19d

MedicalBench: Evaluating Large Language Models Toward Improved Medical Concept Extraction

Este artículo presenta MedicalBench, un nuevo benchmark para evaluar Modelos de Lenguaje Grandes en la extracción de conceptos médicos de registros de salud electrónicos. Se centra en el razonamiento médico implícito y la fundamentación de evidencia, abordando el desafío de identificar conceptos no declarados explícitamente.

LLMs concept extraction Healthcare Benchmarking

RESEARCHarXiv CS.LG·hace 17d

HealthCraft: A Reinforcement Learning Safety Environment for Emergency Medicine

El artículo presenta HealthCraft, un entorno público de aprendizaje por refuerzo para evaluar la seguridad de los modelos de lenguaje de frontera en medicina de emergencia. Se centra en la seguridad a nivel de trayectoria, el uso indebido de herramientas y la presión clínica, construido sobre un estado mundial FHIR R4 y ofreciendo 195 tareas para una evaluación exhaustiva.

LLMs evaluation reinforcement learning medical AI

RESEARCHarXiv CS.LG·hace 27d

Interpretable EEG Microstate Discovery via Variational Deep Embedding: A Systematic Architecture Search with Multi-Quadrant Evaluation

Este artículo presenta el modelo Convolutional Variational Deep Embedding (Conv-VaDE) para el análisis de microestados EEG. Mejora la interpretabilidad al aprender conjuntamente la reconstrucción topográfica y la agrupación probabilística suave, permitiendo la decodificación generativa de prototipos de clústeres en topografías verificables.

deep learning machine learning Neuroscience medical AI

RESEARCHarXiv CS.AI·hace 14d

When Correct Beliefs Collapse: Epistemic Resilience of LLMs under Clinical Pressure

Esta investigación introduce Med-Stress, un marco para evaluar la resiliencia epistémica de los LLM en el diálogo clínico, mostrando que una alta precisión diagnóstica no asegura la estabilidad de creencias bajo presión creciente. Propone RBED y R-FT como nuevas defensas para mitigar este fallo en la IA médica.

LLMs epistemic resilience medical AI AI safety

ARTICLEMIT Tech Review AI·4/5/2026

Tailoring AI solutions for health care needs

El mercado de la IA promete grandes transformaciones, siendo la atención médica un objetivo principal debido a las presiones financieras, la escasez de mano de obra y la creciente carga de cuidar a una población envejecida. Los desarrolladores de IA se centran en funciones variadas, desde curar el cáncer hasta optimizar procesos.

AI applications future-of-work Healthcare medical AI

ARTICLEDEV.to AI·hace 25d

Why AI for Doctors Is Becoming Essential in Modern Medicine

El 94% de los ejecutivos de salud consideran la IA crítica para el futuro de la medicina. La inteligencia artificial asiste a los médicos escaneando imágenes de radiología e identificando cánceres de piel o células cancerosas con rapidez y precisión. Sirve como una poderosa segunda opinión, combinando su velocidad con el juicio humano y el contexto del paciente.

AI integration Healthcare diagnostics medical AI

RESEARCHarXiv CS.LG·7/5/2026

Investigating Trustworthiness of Nonparametric Deep Survival Models for Alzheimer's Disease Progression Analysis

Esta investigación explora la fiabilidad y la equidad de los modelos de supervivencia profunda no paramétricos para analizar la progresión de la Enfermedad de Alzheimer (EA). Aborda la falta de estudios que consideren el sesgo aprendido en los modelos de aprendizaje profundo existentes para la EA y propone nuevas métricas de equidad para garantizar predicciones confiables.

deep learning Alzheimer's disease survival analysis medical AI

RESEARCHarXiv CS.CL·hace 27d

ClinicalBench: Stress-Testing Assertion-Aware Retrieval for Cross-Admission Clinical QA on MIMIC-IV

El artículo presenta ClinicalBench, un nuevo benchmark de 400 preguntas para evaluar la recuperación sensible a afirmaciones en la respuesta a preguntas clínicas en MIMIC-IV usando notas de historias clínicas electrónicas reales. También describe EpiKG, un sistema de grafo de conocimiento del paciente que mejora la recuperación al considerar la negación y la temporalidad, mostrando una mejora significativa en el rendimiento de los LLMs clínicos.

LLMs Benchmarking clinical QA medical AI

RESEARCHarXiv CS.LG·15/4/2026

DBGL: Decay-aware Bipartite Graph Learning for Irregular Medical Time Series Classification

DBGL introduce un novedoso método de Aprendizaje de Grafos Bipartitos con Conciencia de Decaimiento para la clasificación de series temporales médicas irregulares. Emplea un grafo bipartito paciente-variable para capturar patrones de muestreo irregulares y relaciones entre variables, junto con una codificación de decaimiento temporal específica de nodo para la irregularidad de decaimiento de las variables.

Graph Neural Networks machine learning medical AI irregular data

ARTICLEDEV.to AI·17/4/2026

We Built a Medical AI With 383 Specialist Agents. Here's What Actually Works (and What Doesn't)

El artículo comparte aprendizajes de 18 meses construyendo Helios Med, una IA médica con 383 agentes especialistas diseñada para apoyar el razonamiento diagnóstico. Busca ofrecer una segunda opinión exhaustiva a médicos y pacientes, abordando las limitaciones del sistema de salud actual y los errores de diagnóstico.

Healthcare multi-agent systems medical AI diagnostic-aids

RESEARCHarXiv CS.CL·hace 18d

When Cases Get Rare: A Retrieval Benchmark for Off-Guideline Clinical Question Answering

Este artículo presenta OGCaReBench, un nuevo benchmark centrado en la recuperación para evaluar la capacidad de los LLMs de responder a preguntas clínicas que van más allá de las pautas médicas típicas. Aborda la brecha de que la mayoría de los LLMs médicos están entrenados en conocimientos comunes y centrados en pautas, mientras que la práctica real a menudo implica casos raros no cubiertos por estas.

LLMs Benchmarking case reports medical AI

RESEARCHarXiv CS.AI·hace 6d

Traj-Evolve: A Self-Evolving Multi-Agent System for Patient Trajectory Modeling in Lung Cancer Early Detection

Traj-Evolve es un sistema multiagente autoevolutivo para modelar trayectorias de pacientes a partir de registros de salud electrónicos, enfocado en la detección temprana del cáncer de pulmón. Emplea un Pool de Experiencia para recuperar casos similares y aprendizaje por refuerzo multiagente para optimizar la colaboración.

Healthcare machine learning AI multi-agent systems

RESEARCHarXiv CS.AI·17/4/2026

Seeing Through Experts Eyes A Foundational Vision Language Model Trained on Radiologists Gaze and Reasoning

GazeX es un nuevo modelo de lenguaje visual entrenado con datos de seguimiento ocular y razonamiento de radiólogos para mejorar la interpretación de radiografías de tórax. El modelo aprende a emular la atención espacial y temporal experta, con el objetivo de cerrar la brecha entre las salidas del modelo y el razonamiento diagnóstico clínico.

Vision-Language Models computer vision medical AI diagnostic tools

RESEARCHarXiv CS.CL·10/4/2026

EMSDialog: Synthetic Multi-person Emergency Medical Service Dialogue Generation from Electronic Patient Care Reports via Multi-LLM Agents

O estudo apresenta o EMSDialog, um novo conjunto de dados de 4.414 conversas sintéticas multi-falantes para serviços médicos de emergência, geradas a partir de relatórios reais de pacientes usando uma pipeline de agentes multi-LLM. Este dataset, anotado com diagnósticos e tópicos, demonstra melhorias na precisão e estabilidade da previsão de diagnóstico conversacional.

synthetic dialogue generation Healthcare multi-LLM agents medical AI

RESEARCHarXiv CS.LG·1/5/2026

People-Centred Medical Image Analysis

A pesar de los precisos sistemas de diagnóstico de la IA médica centrada en datos, su adopción clínica es limitada por la insuficiente atención a un rendimiento justo en diversas poblaciones de pacientes y a una mala integración en el flujo de trabajo. Este artículo propone un enfoque de 'Análisis de Imágenes Médicas Centrado en las Personas' para abordar estos desafíos interconectados.

human-AI interaction AI ethics medical AI

RESEARCHarXiv CS.CL·hace 20d

Prompting language influences diagnostic reasoning and accuracy of large language models

Esta investigación evaluó el impacto del idioma de las instrucciones en el razonamiento diagnóstico y la precisión de los grandes modelos de lenguaje (LLM) en entornos clínicos. Cuatro de los cinco modelos mostraron un mejor rendimiento en inglés, subrayando la incertidumbre sobre la fiabilidad de los LLM en otros idiomas.

Multilingual AI LLMs clinical decision support Diagnostic Accuracy

ARTICLEDEV.to AI·hace 22d

Medical AI Doesn’t Just Need Bigger Models. It Needs an ImageNet for State Transitions

El artículo propone la creación de un "Biomedical TransitionNet", un nuevo tipo de conjunto de datos análogo a ImageNet, pero centrado en las transiciones de estados biológicos para la próxima generación de IA médica. Argumenta la necesidad de dicha infraestructura para construir modelos del mundo real en biomedicina, yendo más allá de la clasificación y la predicción.

Biomedical TransitionNet datasets AI infrastructure healthcare AI

DOCHugging Face Blog·8/5/2026

MedQA: Fine-Tuning a Clinical AI on AMD ROCm — No CUDA Required

Este contenido detalla el ajuste fino de un modelo de IA clínica, MedQA, en la plataforma AMD ROCm. Destaca la capacidad de realizar esta tarea sin requerir CUDA, ofreciendo una alternativa significativa para el desarrollo de IA.

GPU hardware-compatibility Fine-tuning medical AI