RESEARCH27
Terminus-4B: Can a Smaller Model Replace Frontier LLMs at Agentic Execution Tasks?
arXiv CS.AI·6 de maio de 2026
Esta pesquisa introduz o Terminus-4B, um modelo de linguagem pequeno ajustado, para explorar sua capacidade de substituir LLMs de fronteira em tarefas de execução de terminal agêntico. O modelo é pós-treinado usando SFT e RL com recompensas baseadas em rubricas de LLM como juiz.
Ler original ↗