← heapsort-ai

language model

5 items

NEWS↑ trendingReddit r/LocalLLaMA·hace 18d

[NEW] Supra-50M Released!

SupraLabs ha lanzado Supra-50M, un modelo de lenguaje causal compacto de 50M de parámetros construido con una arquitectura tipo Llama. Entrenado con 20 mil millones de tokens de alta calidad, logra resultados competitivos o superiores en varios benchmarks clave, a pesar de ser mucho más pequeño que modelos abiertos comparables.

[NEW] Supra-50M Released!
42
RESEARCHarXiv CS.CL·hace 25d

VectraYX-Nano: A 42M-Parameter Spanish Cybersecurity Language Model with Curriculum Learning and Native Tool Use

VectraYX-Nano es un modelo de lenguaje en español de 42 millones de parámetros entrenado desde cero para ciberseguridad, con enfoque latinoamericano e invocación nativa de herramientas. Esta investigación detalla su corpus personalizado de 170 millones de tokens, su arquitectura Transformer y una metodología de aprendizaje curricular con replay.

27