← heapsort-ai

Pre-pretraining

1 items

RESEARCHarXiv CS.CL·22d atrás

Language Acquisition Device in Large Language Models

Este artigo propõe um pré-treinamento inspirado no Dispositivo de Aquisição da Linguagem (LAD) usando MP-STRUCT, uma linguagem formal que reflete estruturas de linguagem natural, para melhorar a eficiência de dados de Modelos de Linguagem Grandes. Um breve pré-treinamento com MP-STRUCT atinge a eficiência de token de fortes linhas de base de linguagem formal e confere uma resistência humana a linguagens estruturalmente implausíveis.

27