heapsort
RESEARCH27

Terminus-4B: Can a Smaller Model Replace Frontier LLMs at Agentic Execution Tasks?

arXiv CS.AI·6 de maio de 2026

Esta pesquisa introduz o Terminus-4B, um modelo de linguagem pequeno ajustado, para explorar sua capacidade de substituir LLMs de fronteira em tarefas de execução de terminal agêntico. O modelo é pós-treinado usando SFT e RL com recompensas baseadas em rubricas de LLM como juiz.

Ler original