RESEARCHarXiv CS.LG·9d atrás
LLMs Without Deep Neural Networks: New Architecture, Benefits and Case Study
Este artigo propõe uma nova arquitetura para LLMs que substitui as redes neurais profundas. O modelo, baseado em redes RBF aprimoradas, encontra o ótimo global da função de perda em uma única iteração, eliminando o processo de treinamento demorado.
27