RESEARCH27
Towards Effective Process Supervision in Mathematical Reasoning
Qwen Blog·13 de janeiro de 2025
Modelos de Linguagem Grandes (LLMs) têm feito avanços notáveis no raciocínio matemático, mas podem cometer erros de cálculo ou lógica. Mesmo quando as respostas finais estão corretas, os LLMs podem criar passos de raciocínio plausíveis, mas falhos, comprometendo a confiabilidade de seus processos.
mathematical reasoningLLMsProcess SupervisionAI limitationstrustworthinessAI reliability
Ler original ↗