← heapsort-ai

language model

5 items

NEWS↑ trendingReddit r/LocalLLaMA·il y a 18j

[NEW] Supra-50M Released!

SupraLabs a lancé Supra-50M, un modèle de langage causal compact de 50M de paramètres construit avec une architecture de style Llama. Entraîné sur 20 milliards de tokens de haute qualité, il obtient des résultats compétitifs ou supérieurs sur plusieurs benchmarks clés, bien qu'il soit nettement plus petit que les modèles ouverts comparables.

[NEW] Supra-50M Released!
42
RESEARCHarXiv CS.CL·il y a 25j

VectraYX-Nano: A 42M-Parameter Spanish Cybersecurity Language Model with Curriculum Learning and Native Tool Use

VectraYX-Nano est un modèle de langage espagnol de 42 millions de paramètres, entraîné à partir de zéro pour la cybersécurité avec un accent latino-américain et l'invocation d'outils native. Cette recherche décrit son corpus personnalisé, son architecture Transformer et sa méthodologie d'apprentissage par programme avec replay.

27