RBF Networks — articles, actualités et recherches IA

RESEARCHarXiv CS.LG·il y a 9j

LLMs Without Deep Neural Networks: New Architecture, Benefits and Case Study

Cet article propose une nouvelle architecture pour les LLMs qui ne nécessite pas de réseaux neuronaux profonds. Le modèle, basé sur des réseaux RBF améliorés, atteint l'optimum global de la fonction de perte en une seule itération, supprimant l'étape d'entraînement fastidieuse.

neural networks AI architecture LLMs machine learning