RESEARCH27

Why Fine-Tuning Encourages Hallucinations and How to Fix It

arXiv CS.CL·20 de abril de 2026

Modelos de linguagem grandes frequentemente alucinam fatos, um problema agravado pelo fine-tuning supervisionado (SFT) que degrada o conhecimento pré-treinado. Esta pesquisa propõe um método SFT baseado em autodestilação, inspirado na aprendizagem contínua, para mitigar alucinações regulando o desvio da distribuição de saída, enquanto adquire efetivamente novas informações factuais.

hallucinations large language models Fine-tuning Continual Learning

Ler original ↗