heapsort
RESEARCH28

DR-Venus: Towards Frontier Edge-Scale Deep Research Agents with Only 10K Open Data

arXiv CS.LG·23 avril 2026

DR-Venus présente un agent de recherche approfondie 4B pour le déploiement à l'échelle de la périphérie, entraîné efficacement avec seulement 10K données ouvertes. Sa méthode d'entraînement en deux étapes combine le réglage fin supervisé pour les capacités de base et l'apprentissage par renforcement pour améliorer la fiabilité d'exécution sur des tâches de recherche à long terme.

Lire l'original