heapsort
RESEARCH27

Empirical Evaluation of PDF Parsing and Chunking for Financial Question Answering with RAG

arXiv CS.CL·15 de abril de 2026

O artigo aborda os desafios do processamento automatizado de PDFs para IA, especialmente com sistemas RAG, propondo um estudo empírico. Ele avalia diferentes parsers de PDF e estratégias de chunking para Resposta a Perguntas no domínio financeiro, introduzindo um novo benchmark chamado TableQuest.

Ler original