← heapsort-ai

verifiable AI

2 items

RESEARCHarXiv CS.CL·27d atrás

Correct Answers from Sound Reasoning: Verifiable Process Supervision for Language Models

Este artigo propõe a Supervisão de Processo Verificável (VPS), uma estrutura de pós-treinamento para otimizar a precisão da previsão e a qualidade do raciocínio em modelos de linguagem. O VPS utiliza ajuste fino supervisionado para induzir um formato de raciocínio estruturado, avaliando afirmações intermediárias com sinais de verdade fundamental e ponderação adaptativa de recompensas.

27