RESEARCH27
HEBATRON: A Hebrew-Specialized Open-Weight Mixture-of-Experts Language Model
arXiv CS.CL·13 de maio de 2026
Hebatron é um modelo de linguagem grande de código aberto especializado em hebraico, construído sobre a arquitetura Mixture-of-Experts (MoE) Nemotron-3 da NVIDIA. Ele alcança uma média de raciocínio em hebraico de 73,8%, superando concorrentes e oferecendo maior taxa de transferência de inferência ao ativar menos parâmetros por passagem.
Ler original ↗