heapsort
RESEARCH27

Terminus-4B: Can a Smaller Model Replace Frontier LLMs at Agentic Execution Tasks?

arXiv CS.AI·6. Mai 2026

Diese Forschung stellt Terminus-4B vor, ein feinabgestimmtes kleines Sprachmodell, um dessen Fähigkeit zu untersuchen, Frontier-LLMs bei agentischen Terminalausführungsaufgaben zu ersetzen. Das Modell wird mittels SFT und RL mit rubrikbasierten LLM-als-Richter-Belohnungen nachtrainiert.

Original lesen