heapsort
RESEARCH28

DR-Venus: Towards Frontier Edge-Scale Deep Research Agents with Only 10K Open Data

arXiv CS.LG·23 de abril de 2026

DR-Venus presenta un agente de investigación profunda de 4B para despliegue a escala de borde, entrenado eficazmente con solo 10K datos abiertos. Su receta de entrenamiento de dos etapas combina ajuste fino supervisado para capacidades básicas y aprendizaje por refuerzo para mejorar la fiabilidad en tareas de investigación de largo plazo, optimizando la calidad y utilización de los datos.

Leer original