← heapsort-ai

Tajik Language

1 items

RESEARCHarXiv CS.AI·il y a 12j

Soro: A Lightweight Foundation Model and Chatbot for Tajik

Soro est une famille de grands modèles de langage conversationnels (LLMs) spécialisés en tadjik, conçus pour un déploiement au Tadjikistan avec des contraintes de calcul. Développé à partir de checkpoints Gemma 3 et pré-entraîné sur un corpus tadjik de 1,9 milliard de tokens, il surpasse significativement les modèles de base sur de nouveaux benchmarks tadjiks.

27