← heapsort-ai

healthcare AI

72 items

ARTICLEDEV.to AI·5h atrás

How accurate are AI transcripts for technical or medical terms?

Este artigo aborda a questão crítica da imprecisão das transcrições de IA ao lidar com terminologia técnica e específica de domínio, usando um exemplo de erro médico onde um engano na transcrição levou a uma perigosa troca de medicamentos. Ele destaca como tais erros, não limitados à saúde, podem transformar ferramentas de IA úteis em passivos e explica por que termos especializados são desafiadores para modelos de fala para texto.

62
RESEARCHarXiv CS.LG·18h atrás

MedicalRec: Medical recommender system for image classification without retraining

Este estudo apresenta o MedicalRec, um sistema de recomendação médica para classificação de imagens, projetado para otimizar a seleção de modelos sem a necessidade de retreinamento. Ele aborda os desafios computacionais e energéticos da identificação de modelos, utilizando um conjunto de dados públicamente disponível chamado MedicalRec-Bench, compilado de 3.000 artigos e mais de 5.000 registros de modelos testados.

54
RESEARCHarXiv CS.AI·18h atrás

Reconstructing and forecasting disease trajectories of patients with Alzheimer's disease using routine data in resource-constrained settings

Esta pesquisa visa reconstruir e prever as trajetórias da doença de Alzheimer utilizando dados de rotina em ambientes com recursos limitados. Propõe-se uma estrutura unificada para a previsão bidirecional de pontuações cognitivas a partir de visitas irregulares, permitindo interpolação e extrapolação, além de fornecer estimativas de incerteza calibradas.

54
RESEARCHarXiv CS.CL·4d atrás

Improving Heart-Focused Medical Question Answering in LLMs via Variance-Aware Rubric Rewards with GRPO

Esta pesquisa investiga a otimização de Modelos de Linguagem Grandes (LLMs) para resposta a perguntas médicas focadas no coração, utilizando a Otimização de Política Relativa de Grupo (GRPO) para pós-treinamento. É proposto um Framework de Recompensa Sensível à Variância que melhora a supervisão baseada em rubricas com funções de recompensa analíticas contínuas.

30
RESEARCHDEV.to AI·08/04/2026

QIS Protocol vs Federated Learning: A Distributed Health Data Routing Alternative

O texto apresenta o QIS Protocol como uma alternativa ao Federated Learning para o roteamento de dados de saúde distribuídos, superando suas limitações como vazamento de gradientes e dependência de um agregador central. O QIS oferece privacidade por arquitetura, roteando resultados em vez de parâmetros de modelo com custo logarítmico para aplicações clínicas e de saúde populacional.

30
ARTICLEDEV.to AI·12/04/2026

EU AI Act High-Risk Healthcare AI: Why Centralized Architectures Have a Structural Compliance Problem

O conteúdo aborda um problema estrutural de conformidade para arquiteturas centralizadas de IA na área da saúde, classificadas como de alto risco pelo EU AI Act. Ele destaca a dificuldade dessas arquiteturas em atender a requisitos como explicabilidade e monitoramento de risco contínuo, impondo um desafio significativo para sistemas com prazo de entrada em vigor em agosto de 2024.

30
ARTICLEDEV.to AI·12/04/2026

QIS (Quadratic Intelligence Swarm) vs HPE Swarm Learning: Why Routing Outcomes Beats Routing Gradients

Este conteúdo aborda o desafio da IA em saúde entre hospitais devido à restrição de dados, comparando duas arquiteturas para resolver a federação: HPE Swarm Learning e QIS. A diferença reside em distribuir o treinamento do modelo ou os achados validados, com implicações claras para os casos de uso.

29
CASEDEV.to AI·21/04/2026

Product Case Study- III Incomplete requirements aren’t the exception—they’re the baseline.

Um produto de IA para saúde (ferramenta de anotação de mamografia) falhou na adoção inicial apesar de ser tecnicamente correto, pois não se alinhou aos fluxos de trabalho e padrões de interação esperados pelos radiologistas. Isso ressalta a importância de validar requisitos contra padrões de uso reais, mapear fluxos de trabalho e tratar a adoção como uma métrica de produto.

29
RESEARCHarXiv CS.LG·22/04/2026

Handling and Interpreting Missing Modalities in Patient Clinical Trajectories via Autoregressive Sequence Modeling

Este trabalho aborda o desafio de modalidades ausentes em dados clínicos multimodais para diagnóstico, reformulando-o como uma tarefa de modelagem de sequência autorregressiva. Utiliza decodificadores causais de LLMs e uma pré-treinamento contrastivo consciente da ausência para superar as linhas de base em benchmarks como MIMIC-IV e eICU.

29
RESEARCHarXiv CS.AI·8d atrás

EHRBench: An Automated and Reliable EHR-based Benchmark for Clinical Decision Making with LLMs

O artigo apresenta EHRBench, um benchmark automatizado e confiável baseado em prontuários eletrônicos de saúde (EHRs) para avaliar LLMs na tomada de decisões clínicas, abordando a compreensão insuficiente da confiabilidade dessas em tarefas clínicas reais. O objetivo é garantir escala e qualidade na avaliação de modelos de tomada de decisões clínicas (CDM).

28
ARTICLEDEV.to AI·12/04/2026

QIS Protocol vs Matchmaker Exchange: Two Architectures for Cross-Institutional Rare Disease Intelligence

O texto aborda um problema de arquitetura na inteligência para doenças raras, onde dados cruciais de pacientes ficam isolados globalmente, impedindo diagnósticos e tratamentos eficazes. Ele descreve o Matchmaker Exchange (MME) como uma solução para encontrar fenótipos similares, mas destaca sua limitação em direcionar respostas de tratamento, apontando para a necessidade de um sistema mais abrangente de inteligência entre instituições.

28
DOCDEV.to AI·6d atrás

Building HealthcareAI with Safe MCP Tooling

Este conteúdo descreve uma arquitetura para implementar agentes de IA de forma segura na saúde, utilizando uma ferramenta MCP (Managed Capability Platform) permissionada. Essa camada MCP funciona como um limite de controle crucial, mediando todo o acesso da IA a sistemas internos e validando interações com base em critérios de segurança rigorosos.

28
RESEARCHarXiv CS.LG·22d atrás

MuteBench: Modality Unavailability Tolerance Evaluation for Incomplete Multimodal Fusion

MuteBench é um novo benchmark para avaliar arquiteturas de fusão multimodal em sistemas de IA clínica, abordando falhas de sensores que resultam em dados ausentes. Abrange diversos conjuntos de dados, arquiteturas de fusão e dois modos de dados ausentes, mostrando que a família da arquitetura é o preditor mais forte de robustez.

28