← heapsort-ai

SLMs

4 items

RESEARCHarXiv CS.LG·23/4/2026

DR-Venus: Towards Frontier Edge-Scale Deep Research Agents with Only 10K Open Data

DR-Venus presenta un agente de investigación profunda de 4B para despliegue a escala de borde, entrenado eficazmente con solo 10K datos abiertos. Su receta de entrenamiento de dos etapas combina ajuste fino supervisado para capacidades básicas y aprendizaje por refuerzo para mejorar la fiabilidad en tareas de investigación de largo plazo, optimizando la calidad y utilización de los datos.

28
RESEARCHarXiv CS.CL·8/5/2026

A Few Good Clauses: Comparing LLMs vs Domain-Trained Small Language Models on Structured Contract Extraction

Este documento evalúa si un Small Language Model (SLM) entrenado en un dominio puede superar a los Large Language Models (LLMs) de vanguardia en la extracción estructurada de contratos con un costo radicalmente menor. Olava Extract logró el rendimiento agregado más sólido y las puntuaciones de precisión más altas, reduciendo los costos de inferencia en un 78% al 97%.

27
NEWSDEV.to AI·15/4/2026

AI‑powered Git commits using Small Language Models

El contenido anuncia el lanzamiento de AI Git, una herramienta que genera mensajes de commit de Git utilizando modelos de lenguaje locales como Ollama. Demuestra su uso para refinar el título de un README.md, asegurando la capitalización consistente y el cumplimiento de las convenciones de nomenclatura.

23