← heapsort-ai

SLMs

4 items

RESEARCHarXiv CS.LG·4/23/2026

DR-Venus: Towards Frontier Edge-Scale Deep Research Agents with Only 10K Open Data

DR-Venus stellt einen führenden 4B Deep Research Agent für Edge-Scale-Bereitstellung vor, der effektiv mit nur 10K offenen Daten trainiert wurde. Das Training erfolgt in zwei Stufen: Supervised Fine-Tuning für grundlegende Agentenfunktionen, gefolgt von Reinforcement Learning zur Verbesserung der Ausführungssicherheit bei komplexen Forschungsaufgaben.

28
RESEARCHarXiv CS.CL·5/8/2026

A Few Good Clauses: Comparing LLMs vs Domain-Trained Small Language Models on Structured Contract Extraction

Diese Studie untersucht, ob ein domänentrainiertes Small Language Model (SLM) Large Language Models (LLMs) bei der strukturierten Vertragsextraktion übertreffen kann, und das zu deutlich geringeren Kosten. Olava Extract erreichte die stärkste Gesamtleistung und die höchsten Präzisionswerte, während die Inferenzkosten um 78% bis 97% gesenkt wurden.

27
NEWSDEV.to AI·4/15/2026

AI‑powered Git commits using Small Language Models

AI Git, ein Tool zur Generierung von Git-Commit-Nachrichten mithilfe lokaler Sprachmodelle wie Ollama, wurde veröffentlicht. Es demonstriert seine Anwendung, um den Titel einer README.md-Datei bezüglich einheitlicher Großschreibung und Namenskonventionen zu verfeinern.

23