RESEARCH27

Distribution Corrected Offline Data Distillation for Large Language Models

arXiv CS.CL·15 de maio de 2026

Esta pesquisa propõe um framework de destilação de raciocínio offline para Grandes Modelos de Linguagem (LLMs) visando aprimorar a inteligência em ambientes com recursos limitados. O método aborda o problema de deriva distribucional em abordagens offline existentes, corrigindo discrepâncias entre professor e aluno, enquanto mantém a eficiência e a qualidade da supervisão.

Data Distillation Offline Distillation machine learning large language models AI research

Ler original ↗