Math Reasoning

2 items

RESEARCHarXiv CS.AI·09/04/2026

ProofSketcher: Hybrid LLM + Lightweight Proof Checker for Reliable Math/Logic Reasoning

Este conteúdo apresenta 'ProofSketcher', um sistema híbrido de LLM com verificador de provas leves para garantir o raciocínio matemático e lógico. Ele visa corrigir falhas sutis em argumentos de LLMs, contrastando com a complexidade da formalização completa exigida por provadores de teoremas como Lean e Coq.

Proof Checker Math Reasoning Logic reasoning Reliability

RESEARCHarXiv CS.CL·06/04/2026

Reinforcement Learning-based Knowledge Distillation with LLM-as-a-Judge

Este artigo propõe uma estrutura de Reinforcement Learning (RL) que utiliza um LLM como juiz para gerar recompensas, permitindo a destilação de conhecimento sem a necessidade de rótulos de verdade fundamental. A abordagem demonstra ganhos substanciais de desempenho em benchmarks de raciocínio matemático, sugerindo que avaliadores baseados em LLM podem produzir sinais de treinamento eficazes.

language models Unlabeled Data Knowledge Distillation Math Reasoning