← heapsort-ai

SLMs

4 items

RESEARCHarXiv CS.LG·23/04/2026

DR-Venus: Towards Frontier Edge-Scale Deep Research Agents with Only 10K Open Data

DR-Venus présente un agent de recherche approfondie 4B pour le déploiement à l'échelle de la périphérie, entraîné efficacement avec seulement 10K données ouvertes. Sa méthode d'entraînement en deux étapes combine le réglage fin supervisé pour les capacités de base et l'apprentissage par renforcement pour améliorer la fiabilité d'exécution sur des tâches de recherche à long terme.

28
RESEARCHarXiv CS.CL·08/05/2026

A Few Good Clauses: Comparing LLMs vs Domain-Trained Small Language Models on Structured Contract Extraction

Cet article évalue si un Small Language Model (SLM) entraîné sur un domaine peut surpasser les Large Language Models (LLMs) de pointe pour l'extraction de contrats structurés à un coût radicalement inférieur. Olava Extract a obtenu les performances agrégées les plus solides et des scores de précision plus élevés, réduisant les coûts d'inférence de 78% à 97%.

27
NEWSDEV.to AI·15/04/2026

AI‑powered Git commits using Small Language Models

Le contenu annonce le lancement d'AI Git, un outil qui génère des messages de commit Git à l'aide de modèles de langage locaux tels qu'Ollama. Il démontre son utilisation pour affiner le titre d'un fichier README.md, garantissant une capitalisation cohérente et le respect des conventions de nommage.

23