← heapsort-ai

language model

5 items

NEWS↑ trendingReddit r/LocalLLaMA·18d atrás

[NEW] Supra-50M Released!

A SupraLabs lançou o Supra-50M, um modelo de linguagem causal compacto de 50M de parâmetros construído com arquitetura estilo Llama. Treinado em 20 bilhões de tokens, ele atinge resultados competitivos ou superiores em benchmarks chave, apesar de ser significativamente menor que modelos abertos comparáveis.

[NEW] Supra-50M Released!
42
RESEARCHarXiv CS.CL·25d atrás

VectraYX-Nano: A 42M-Parameter Spanish Cybersecurity Language Model with Curriculum Learning and Native Tool Use

VectraYX-Nano é um modelo de linguagem espanhol de 42 milhões de parâmetros, desenvolvido do zero para cibersegurança, com foco latino-americano e invocação nativa de ferramentas. A pesquisa descreve seu corpus personalizado, arquitetura Transformer e metodologia de aprendizado curricular com replay.

27