RESEARCHarXiv CS.LG·hace 9d
LLMs Without Deep Neural Networks: New Architecture, Benefits and Case Study
Este artículo presenta una arquitectura novedosa para LLMs que prescinde de las redes neuronales profundas. El modelo propuesto, basado en redes RBF, encuentra el óptimo global de la función de pérdida en una sola iteración, eliminando el paso de entrenamiento tedioso.
27