medical AI

34 items

RESEARCHarXiv CS.AI·19h atrás

PathoSage: Towards Multi-Source Evidence Adjudication in Pathology via Experience-Aware Agentic Workflow

PathoSage é uma estrutura de três estágios que aborda a adjudicação de evidências em patologia, separando explicitamente a recuperação de conhecimento, coleta e adjudicação de evidências. Ela utiliza um sistema agêntico com Deliberação Estruturada de Evidências para avaliar de forma independente dados heterogêneos e reduzir vieses.

agent workflows MLLMs pathology medical AI

RESEARCHDEV.to AI·18/04/2026

ChatCAD: Interactive Computer-Aided Diagnosis on Medical Image using LargeLanguage Models

ChatCAD é um sistema interativo de diagnóstico assistido por computador que utiliza Grandes Modelos de Linguagem para analisar imagens médicas. Ele visa aprimorar a precisão e a eficiência do diagnóstico médico por meio da inteligência artificial.

computer-aided diagnosis Healthcare large language models Medical Imaging

RESEARCHarXiv CS.CL·19d atrás

MedicalBench: Evaluating Large Language Models Toward Improved Medical Concept Extraction

Este artigo apresenta o MedicalBench, um novo benchmark para avaliar Large Language Models na extração de conceitos médicos de registros eletrônicos de saúde. Ele se concentra no raciocínio médico implícito e na fundamentação de evidências, superando o desafio de identificar conceitos não explicitamente declarados.

LLMs concept extraction Healthcare Benchmarking

RESEARCHarXiv CS.LG·17d atrás

HealthCraft: A Reinforcement Learning Safety Environment for Emergency Medicine

O artigo apresenta o HealthCraft, um ambiente público de aprendizado por reforço para avaliar a segurança de modelos de linguagem de fronteira na medicina de emergência. Ele foca na segurança em nível de trajetória, uso indevido de ferramentas e pressão clínica, construído sobre um estado de mundo FHIR R4 e oferecendo 195 tarefas para avaliação abrangente.

LLMs evaluation reinforcement learning medical AI

RESEARCHarXiv CS.LG·27d atrás

Interpretable EEG Microstate Discovery via Variational Deep Embedding: A Systematic Architecture Search with Multi-Quadrant Evaluation

Este artigo apresenta o modelo Convolutional Variational Deep Embedding (Conv-VaDE) para análise de microestados de EEG. Ele aprimora a interpretabilidade ao aprender reconstrução topográfica e agrupamento probabilístico suave, permitindo a decodificação generativa de protótipos de clusters em topografias verificáveis.

deep learning machine learning Neuroscience medical AI

RESEARCHarXiv CS.AI·14d atrás

When Correct Beliefs Collapse: Epistemic Resilience of LLMs under Clinical Pressure

Esta pesquisa apresenta o Med-Stress, uma estrutura para testar a resiliência epistêmica de LLMs em diálogo clínico, revelando que a alta precisão diagnóstica não garante a estabilidade de crenças sob pressão. Propõe RBED e R-FT como novas defesas para mitigar este modo de falha na IA médica.

LLMs epistemic resilience medical AI AI safety

ARTICLEMIT Tech Review AI·04/05/2026

Tailoring AI solutions for health care needs

O mercado de IA promete grandes transformações, com a saúde sendo um alvo principal devido a pressões financeiras, escassez de mão de obra e o aumento da carga de cuidados para uma população envelhecida. Desenvolvedores de IA visam diversas funções, desde curar o câncer até otimizar processos.

AI applications future-of-work Healthcare medical AI

ARTICLEDEV.to AI·25d atrás

Why AI for Doctors Is Becoming Essential in Modern Medicine

94% dos executivos de saúde consideram a IA crucial para o futuro da medicina. A inteligência artificial auxilia médicos ao digitalizar imagens de radiologia e identificar cânceres de pele ou células cancerosas com rapidez e precisão. Ela atua como uma segunda opinião poderosa, combinando sua velocidade com o julgamento humano e o contexto do paciente.

AI integration Healthcare diagnostics medical AI

RESEARCHarXiv CS.LG·07/05/2026

Investigating Trustworthiness of Nonparametric Deep Survival Models for Alzheimer's Disease Progression Analysis

Esta pesquisa examina a confiabilidade e a justiça de modelos de sobrevivência profunda não paramétricos para analisar a progressão da Doença de Alzheimer (DA). O estudo aborda a escassez de pesquisas que consideram o viés aprendido em modelos de aprendizado profundo para DA e propõe novas métricas de justiça para garantir previsões fidedignas.

deep learning Alzheimer's disease survival analysis medical AI

RESEARCHarXiv CS.CL·27d atrás

ClinicalBench: Stress-Testing Assertion-Aware Retrieval for Cross-Admission Clinical QA on MIMIC-IV

O artigo apresenta o ClinicalBench, um novo teste de 400 perguntas para avaliar a recuperação de informações sensíveis a afirmações em notas de prontuários eletrônicos reais no MIMIC-IV. Ele também descreve o EpiKG, um sistema de grafo de conhecimento do paciente que melhora a recuperação ao considerar negação e temporalidade, resultando em uma melhoria significativa no desempenho de LLMs clínicos.

LLMs Benchmarking clinical QA medical AI

RESEARCHarXiv CS.LG·15/04/2026

DBGL: Decay-aware Bipartite Graph Learning for Irregular Medical Time Series Classification

DBGL apresenta um novo método de Aprendizagem de Grafo Bipartido com Consciência de Decaimento para classificar séries temporais médicas irregulares. Ele emprega um grafo bipartido paciente-variável para capturar padrões de amostragem irregulares e relações entre variáveis, além de uma codificação de decaimento temporal específica de nó para a irregularidade de decaimento das variáveis.

Graph Neural Networks machine learning medical AI irregular data

ARTICLEDEV.to AI·17/04/2026

We Built a Medical AI With 383 Specialist Agents. Here's What Actually Works (and What Doesn't)

O artigo compartilha insights de 18 meses de construção do Helios Med, uma IA médica com 383 agentes especialistas para auxiliar no raciocínio diagnóstico. O objetivo é oferecer uma segunda opinião detalhada para médicos e pacientes, abordando as limitações das práticas de saúde atuais e erros de diagnóstico.

Healthcare multi-agent systems medical AI diagnostic-aids

RESEARCHarXiv CS.CL·18d atrás

When Cases Get Rare: A Retrieval Benchmark for Off-Guideline Clinical Question Answering

Este artigo apresenta OGCaReBench, um novo benchmark focado em recuperação para avaliar a capacidade de LLMs de responder a perguntas clínicas que vão além das diretrizes médicas típicas. Ele aborda a lacuna de que a maioria dos LLMs médicos é treinada em conhecimento comum e focado em diretrizes, enquanto a prática real frequentemente exige lidar com casos raros não cobertos por elas.

LLMs Benchmarking case reports medical AI

RESEARCHarXiv CS.AI·6d atrás

Traj-Evolve: A Self-Evolving Multi-Agent System for Patient Trajectory Modeling in Lung Cancer Early Detection

Traj-Evolve é um sistema multiagente autoevoluído para modelar trajetórias de pacientes a partir de registros de saúde eletrônicos, visando a detecção precoce de câncer de pulmão. Ele utiliza um Pool de Experiência para recuperar casos semelhantes e aprendizagem por reforço multiagente para otimizar a colaboração entre agentes.

Healthcare machine learning AI multi-agent systems

RESEARCHarXiv CS.AI·17/04/2026

Seeing Through Experts Eyes A Foundational Vision Language Model Trained on Radiologists Gaze and Reasoning

GazeX é um novo modelo de linguagem visual treinado com dados de rastreamento ocular e raciocínio de radiologistas para melhorar a interpretação de radiografias de tórax. O modelo aprende a emular a atenção espacial e temporal de especialistas, visando preencher a lacuna entre as saídas do modelo e o raciocínio diagnóstico clínico.

Vision-Language Models computer vision medical AI diagnostic tools

RESEARCHarXiv CS.CL·10/04/2026

EMSDialog: Synthetic Multi-person Emergency Medical Service Dialogue Generation from Electronic Patient Care Reports via Multi-LLM Agents

O estudo apresenta o EMSDialog, um novo conjunto de dados de 4.414 conversas sintéticas multi-falantes para serviços médicos de emergência, geradas a partir de relatórios reais de pacientes usando uma pipeline de agentes multi-LLM. Este dataset, anotado com diagnósticos e tópicos, demonstra melhorias na precisão e estabilidade da previsão de diagnóstico conversacional.

synthetic dialogue generation Healthcare multi-LLM agents medical AI

RESEARCHarXiv CS.LG·01/05/2026

People-Centred Medical Image Analysis

Apesar dos sistemas de diagnóstico precisos da IA médica orientada a dados, a adoção clínica é limitada pela falta de atenção à performance justa em populações diversas e à integração de fluxo de trabalho. Este artigo propõe uma abordagem de 'Análise de Imagem Médica Centrada nas Pessoas' para resolver esses desafios interligados, frequentemente examinados isoladamente.

human-AI interaction AI ethics medical AI

RESEARCHarXiv CS.CL·20d atrás

Prompting language influences diagnostic reasoning and accuracy of large language models

Esta pesquisa avaliou o impacto do idioma de prompt no raciocínio diagnóstico e na precisão de grandes modelos de linguagem (LLMs) em contextos clínicos. Quatro dos cinco modelos testados demonstraram melhor desempenho em inglês, evidenciando a incerteza quanto à confiabilidade dos LLMs em outros idiomas.

Multilingual AI LLMs clinical decision support Diagnostic Accuracy

ARTICLEDEV.to AI·21d atrás

Medical AI Doesn’t Just Need Bigger Models. It Needs an ImageNet for State Transitions

O artigo propõe a criação de um "Biomedical TransitionNet", um novo tipo de dataset análogo ao ImageNet, mas focado em transições de estado biológico para a próxima geração de IA médica. Ele argumenta a necessidade de tal infraestrutura para construir modelos do mundo real em biomedicina, indo além da classificação e previsão.

Biomedical TransitionNet datasets AI infrastructure healthcare AI

DOCHugging Face Blog·08/05/2026

MedQA: Fine-Tuning a Clinical AI on AMD ROCm — No CUDA Required

Este artigo descreve o ajuste fino de uma IA clínica (MedQA) na plataforma AMD ROCm. Ele demonstra como realizar esta tarefa sem a necessidade de CUDA, apresentando uma alternativa crucial para o desenvolvimento de IA.

GPU hardware-compatibility Fine-tuning medical AI