notch
RESEARCH27

Towards Effective Process Supervision in Mathematical Reasoning

Qwen Blog·13 de janeiro de 2025

Modelos de Linguagem Grandes (LLMs) têm feito avanços notáveis no raciocínio matemático, mas podem cometer erros de cálculo ou lógica. Mesmo quando as respostas finais estão corretas, os LLMs podem criar passos de raciocínio plausíveis, mas falhos, comprometendo a confiabilidade de seus processos.

mathematical reasoningLLMsProcess SupervisionAI limitationstrustworthinessAI reliability
Ler original