← heapsort-ai

Question Answering

9 items

RESEARCHarXiv CS.CL·hace 20h

Retrieval Augmented Generation Framework for the Nepali Legal Domain Question Answering

Este estudio presenta la primera aplicación de un modelo de Generación Aumentada por Recuperación (RAG) para la respuesta a preguntas legales en nepalí, abordando la escasez de datos en idiomas de bajos recursos. Utilizando BM25 en documentos fragmentados, el pipeline RAG logró alta precisión y veracidad, demostrando su eficacia en el dominio legal nepalí.

54
RESEARCHarXiv CS.CL·9/4/2026

Consistency-Guided Decoding with Proof-Driven Disambiguation for Three-Way Logical Question Answering

Este conteúdo apresenta CGD-PD, uma camada leve para modelos de linguagem grandes (LLMs) que melhora a resposta a perguntas lógicas de três vias (Verdadeiro/Falso/Desconhecido). Ele aborda falhas recorrentes como inconsistência de negação e previsões 'Desconhecido' epistêmicas, utilizando decisões consistentes e desambiguação baseada em prova para maior precisão.

29
RESEARCHarXiv CS.CL·24/4/2026

GRISP: Guided Recurrent IRI Selection over SPARQL Skeletons

GRISP es un novedoso método de respuesta a preguntas basado en SPARQL sobre grafos de conocimiento, que utiliza un pequeño modelo de lenguaje (SLM) ajustado. Genera esqueletos de consultas SPARQL a partir de preguntas en lenguaje natural y los refina seleccionando elementos del grafo, logrando resultados de vanguardia en benchmarks como Wikidata y Freebase.

29
RESEARCHarXiv CS.AI·hace 4d

Synthetic Contrastive Reasoning for Multi-Table Q&A

El artículo introduce un conjunto de datos sintético de rastreo de razonamiento contrastivo para la respuesta a preguntas multi-tabla (MMQA), con el objetivo de proporcionar supervisión de razonamiento que falta en los recursos existentes. Los LLM de código abierto, ajustados con Optimización de Preferencia Contrastiva (CPO) utilizando este conjunto de datos, mostraron mejoras significativas en el rendimiento.

28
RESEARCHarXiv CS.AI·7/5/2026

Temporal Reasoning Is Not the Bottleneck: A Probabilistic Inconsistency Framework for Neuro-Symbolic QA

Este trabajo de investigación sostiene que el cuello de botella en el razonamiento temporal de los grandes modelos de lenguaje no es la deducción lógica, sino la representación no estructurada de texto a evento. Presenta un marco neuro-simbólico de preguntas y respuestas que utiliza una Señal de Inconsistencia Probabilística (PIS) para desvincular la extracción semántica del razonamiento simbólico.

28
RESEARCHarXiv CS.AI·25/4/2026

HypEHR: Hyperbolic Modeling of Electronic Health Records for Efficient Question Answering

HypEHR es un modelo compacto que emplea geometría hiperbólica para la respuesta a preguntas sobre Registros Médicos Electrónicos (EHR), superando los desafíos de costo y estructura jerárquica de los métodos basados en LLM. Se preentrena para la predicción de diagnósticos y la alineación con ontologías médicas, logrando un rendimiento comparable al de los LLM con muchos menos parámetros.

27
RESEARCHarXiv CS.CL·15/4/2026

Empirical Evaluation of PDF Parsing and Chunking for Financial Question Answering with RAG

El artículo aborda los desafíos del procesamiento automatizado de PDF para IA, especialmente con sistemas RAG, mediante un estudio empírico propuesto. Evalúa diferentes analizadores de PDF y estrategias de fragmentación para la respuesta a preguntas en el dominio financiero, introduciendo un nuevo benchmark llamado TableQuest.

27
RESEARCHarXiv CS.AI·9/5/2026

Agentic Retrieval-Augmented Generation for Financial Document Question Answering

Este artículo presenta FinAgent-RAG, un marco RAG agéntico para la respuesta a preguntas en documentos financieros, centrado en el razonamiento numérico complejo. Orquesta bucles iterativos de recuperación y razonamiento con auto-verificación, integrando un Contrastive Financial Retriever y un módulo Program-of-Thought para aritmética precisa.

27