← heapsort-ai

medical AI

34 items

RESEARCHarXiv CS.AI·19h atrás

PathoSage: Towards Multi-Source Evidence Adjudication in Pathology via Experience-Aware Agentic Workflow

PathoSage é uma estrutura de três estágios que aborda a adjudicação de evidências em patologia, separando explicitamente a recuperação de conhecimento, coleta e adjudicação de evidências. Ela utiliza um sistema agêntico com Deliberação Estruturada de Evidências para avaliar de forma independente dados heterogêneos e reduzir vieses.

54
RESEARCHarXiv CS.LG·17d atrás

HealthCraft: A Reinforcement Learning Safety Environment for Emergency Medicine

O artigo apresenta o HealthCraft, um ambiente público de aprendizado por reforço para avaliar a segurança de modelos de linguagem de fronteira na medicina de emergência. Ele foca na segurança em nível de trajetória, uso indevido de ferramentas e pressão clínica, construído sobre um estado de mundo FHIR R4 e oferecendo 195 tarefas para avaliação abrangente.

29
RESEARCHarXiv CS.LG·27d atrás

Interpretable EEG Microstate Discovery via Variational Deep Embedding: A Systematic Architecture Search with Multi-Quadrant Evaluation

Este artigo apresenta o modelo Convolutional Variational Deep Embedding (Conv-VaDE) para análise de microestados de EEG. Ele aprimora a interpretabilidade ao aprender reconstrução topográfica e agrupamento probabilístico suave, permitindo a decodificação generativa de protótipos de clusters em topografias verificáveis.

29
RESEARCHarXiv CS.LG·07/05/2026

Investigating Trustworthiness of Nonparametric Deep Survival Models for Alzheimer's Disease Progression Analysis

Esta pesquisa examina a confiabilidade e a justiça de modelos de sobrevivência profunda não paramétricos para analisar a progressão da Doença de Alzheimer (DA). O estudo aborda a escassez de pesquisas que consideram o viés aprendido em modelos de aprendizado profundo para DA e propõe novas métricas de justiça para garantir previsões fidedignas.

28
RESEARCHarXiv CS.CL·27d atrás

ClinicalBench: Stress-Testing Assertion-Aware Retrieval for Cross-Admission Clinical QA on MIMIC-IV

O artigo apresenta o ClinicalBench, um novo teste de 400 perguntas para avaliar a recuperação de informações sensíveis a afirmações em notas de prontuários eletrônicos reais no MIMIC-IV. Ele também descreve o EpiKG, um sistema de grafo de conhecimento do paciente que melhora a recuperação ao considerar negação e temporalidade, resultando em uma melhoria significativa no desempenho de LLMs clínicos.

28
RESEARCHarXiv CS.LG·15/04/2026

DBGL: Decay-aware Bipartite Graph Learning for Irregular Medical Time Series Classification

DBGL apresenta um novo método de Aprendizagem de Grafo Bipartido com Consciência de Decaimento para classificar séries temporais médicas irregulares. Ele emprega um grafo bipartido paciente-variável para capturar padrões de amostragem irregulares e relações entre variáveis, além de uma codificação de decaimento temporal específica de nó para a irregularidade de decaimento das variáveis.

28
ARTICLEDEV.to AI·17/04/2026

We Built a Medical AI With 383 Specialist Agents. Here's What Actually Works (and What Doesn't)

O artigo compartilha insights de 18 meses de construção do Helios Med, uma IA médica com 383 agentes especialistas para auxiliar no raciocínio diagnóstico. O objetivo é oferecer uma segunda opinião detalhada para médicos e pacientes, abordando as limitações das práticas de saúde atuais e erros de diagnóstico.

28
RESEARCHarXiv CS.CL·18d atrás

When Cases Get Rare: A Retrieval Benchmark for Off-Guideline Clinical Question Answering

Este artigo apresenta OGCaReBench, um novo benchmark focado em recuperação para avaliar a capacidade de LLMs de responder a perguntas clínicas que vão além das diretrizes médicas típicas. Ele aborda a lacuna de que a maioria dos LLMs médicos é treinada em conhecimento comum e focado em diretrizes, enquanto a prática real frequentemente exige lidar com casos raros não cobertos por elas.

28
RESEARCHarXiv CS.AI·6d atrás

Traj-Evolve: A Self-Evolving Multi-Agent System for Patient Trajectory Modeling in Lung Cancer Early Detection

Traj-Evolve é um sistema multiagente autoevoluído para modelar trajetórias de pacientes a partir de registros de saúde eletrônicos, visando a detecção precoce de câncer de pulmão. Ele utiliza um Pool de Experiência para recuperar casos semelhantes e aprendizagem por reforço multiagente para otimizar a colaboração entre agentes.

28
RESEARCHarXiv CS.AI·17/04/2026

Seeing Through Experts Eyes A Foundational Vision Language Model Trained on Radiologists Gaze and Reasoning

GazeX é um novo modelo de linguagem visual treinado com dados de rastreamento ocular e raciocínio de radiologistas para melhorar a interpretação de radiografias de tórax. O modelo aprende a emular a atenção espacial e temporal de especialistas, visando preencher a lacuna entre as saídas do modelo e o raciocínio diagnóstico clínico.

27
RESEARCHarXiv CS.CL·10/04/2026

EMSDialog: Synthetic Multi-person Emergency Medical Service Dialogue Generation from Electronic Patient Care Reports via Multi-LLM Agents

O estudo apresenta o EMSDialog, um novo conjunto de dados de 4.414 conversas sintéticas multi-falantes para serviços médicos de emergência, geradas a partir de relatórios reais de pacientes usando uma pipeline de agentes multi-LLM. Este dataset, anotado com diagnósticos e tópicos, demonstra melhorias na precisão e estabilidade da previsão de diagnóstico conversacional.

27
RESEARCHarXiv CS.LG·01/05/2026

People-Centred Medical Image Analysis

Apesar dos sistemas de diagnóstico precisos da IA médica orientada a dados, a adoção clínica é limitada pela falta de atenção à performance justa em populações diversas e à integração de fluxo de trabalho. Este artigo propõe uma abordagem de 'Análise de Imagem Médica Centrada nas Pessoas' para resolver esses desafios interligados, frequentemente examinados isoladamente.

27
ARTICLEDEV.to AI·21d atrás

Medical AI Doesn’t Just Need Bigger Models. It Needs an ImageNet for State Transitions

O artigo propõe a criação de um "Biomedical TransitionNet", um novo tipo de dataset análogo ao ImageNet, mas focado em transições de estado biológico para a próxima geração de IA médica. Ele argumenta a necessidade de tal infraestrutura para construir modelos do mundo real em biomedicina, indo além da classificação e previsão.

27