← heapsort-ai

logical reasoning

5 items

RESEARCHarXiv CS.CL·09/04/2026

Consistency-Guided Decoding with Proof-Driven Disambiguation for Three-Way Logical Question Answering

Este conteúdo apresenta CGD-PD, uma camada leve para modelos de linguagem grandes (LLMs) que melhora a resposta a perguntas lógicas de três vias (Verdadeiro/Falso/Desconhecido). Ele aborda falhas recorrentes como inconsistência de negação e previsões 'Desconhecido' epistêmicas, utilizando decisões consistentes e desambiguação baseada em prova para maior precisão.

29
RESEARCHarXiv CS.LG·13d atrás

When Rule Violations Are Rare: Chimera Training for Logical Anomaly Detection

Este artigo propõe um método de detecção de anomalias chamado Chimera Training, focado em violações de restrições semânticas dadas como regras lógicas sobre conceitos visuais aprendidos. Utiliza um avaliador de regras neural que compila restrições em grafos, aprendendo operadores lógicos para calcular probabilidades de satisfação de regras, mesmo com dados de treinamento escassos para violações reais.

27
RESEARCHarXiv CS.AI·20/04/2026

Structured Abductive-Deductive-Inductive Reasoning for LLMs via Algebraic Invariants

Esta pesquisa apresenta um arcabouço de raciocínio simbólico para resolver as limitações sistemáticas de LLMs no raciocínio lógico estruturado, como a confusão entre geração e verificação de hipóteses. Ele implementa a inferência tripartida de Peirce, garantindo consistência lógica por meio de invariantes algébricos, com o 'Weakest Link bound' impedindo que as conclusões excedam a confiabilidade da premissa mais fraca.

27
RESEARCHarXiv CS.AI·17d atrás

The Impact of AI Usage and Informativeness on Skill Development in Logical Reasoning

Este estudo examina como o uso e a informatividade da IA afetam o desenvolvimento de habilidades em raciocínio lógico. Conclui que um maior uso da IA está associado a um desenvolvimento de habilidades mais fraco, especialmente com IA de baixa informação, enquanto a IA de alta informação pode melhorar o desempenho a curto prazo sem reduzir os resultados pós-IA em média.

27