RESEARCHarXiv CS.LG·vor 9T
LLMs Without Deep Neural Networks: New Architecture, Benefits and Case Study
Dieser Artikel präsentiert eine neuartige Architektur für LLMs, die ohne tiefe neuronale Netze auskommt. Das vorgeschlagene Modell, basierend auf erweiterten RBF-Netzwerken, findet das globale Optimum der Verlustfunktion in einem einzigen Iterationsschritt, wodurch der aufwendige Trainingsprozess entfällt.
27