← heapsort-ai

Information Extraction

10 items

RESEARCHarXiv CS.CL·17/04/2026

EviSearch: A Human in the Loop System for Extracting and Auditing Clinical Evidence for Systematic Reviews

EviSearch é um sistema de IA multiagente que automatiza a extração e auditoria de evidências clínicas de PDFs de ensaios para revisões sistemáticas. Ele garante a proveniência de cada célula e melhora a precisão, utilizando agentes especializados e um módulo de reconciliação para verificação humana.

27
RESEARCHarXiv CS.CL·30/04/2026

Information Extraction from Electricity Invoices with General-Purpose Large Language Models

Este estudo avalia a capacidade de LLMs de propósito geral para extrair informações de faturas de eletricidade espanholas sem fine-tuning, destacando que a qualidade do prompt é mais crucial que a otimização de hiperparâmetros. As estratégias few-shot superam as zero-shot em mais de 19 pontos percentuais de F1-score.

27
RESEARCHarXiv CS.CL·07/05/2026

Self-Prompting Small Language Models for Privacy-Sensitive Clinical Information Extraction

Esta pesquisa apresenta uma estrutura implementável localmente que permite a pequenos modelos de linguagem extrair entidades clínicas sensíveis à privacidade de notas odontológicas não estruturadas, através de prompts auto-gerados e refinados. O estudo avaliou modelos de peso aberto, alcançando altas pontuações F1 com Qwen2.5-14B-Instruct e Llama-3.1-8B-Instruct após ajuste fino supervisionado e otimização direta de preferência.

27
RESEARCHarXiv CS.CL·06/05/2026

MedStruct-S: A Benchmark for Key Discovery, Key-Conditioned QA and Semi-Structured Extraction from OCR Clinical Reports

MedStruct-S é um novo benchmark para a extração de informações semi-estruturadas de relatórios clínicos derivados de OCR, abordando desafios como representações de chaves heterogêneas e ruído de OCR. Ele visa avaliar a robustez de modelos em cenários do mundo real para descoberta de chaves, QA condicionado a chaves e extração de pares chave-valor.

27
RESEARCHarXiv CS.CL·06/05/2026

Effective Performance Measurement: Challenges and Opportunities in KPI Extraction from Earnings Calls

Este artigo de pesquisa explora os desafios da extração de KPIs de chamadas de lucros não estruturadas, em contraste com os documentos padronizados da SEC. Ele apresenta três novos benchmarks (SECB, ECB e ECB-A) para avaliar modelos, revelando que os modelos baseados em codificadores enfrentam dificuldades com a mudança de domínio.

27