RESEARCH27
Terminus-4B: Can a Smaller Model Replace Frontier LLMs at Agentic Execution Tasks?
arXiv CS.AI·6 de mayo de 2026
Esta investigación presenta Terminus-4B, un modelo de lenguaje pequeño ajustado, para explorar su capacidad de reemplazar LLMs de frontera en tareas de ejecución de terminal agéntico. El modelo es post-entrenado usando SFT y RL con recompensas basadas en rúbricas de LLM como juez.
Leer original ↗