← heapsort-ai

machine learning training

1 items

RESEARCHarXiv CS.LG·4/23/2026

DR-Venus: Towards Frontier Edge-Scale Deep Research Agents with Only 10K Open Data

DR-Venus stellt einen führenden 4B Deep Research Agent für Edge-Scale-Bereitstellung vor, der effektiv mit nur 10K offenen Daten trainiert wurde. Das Training erfolgt in zwei Stufen: Supervised Fine-Tuning für grundlegende Agentenfunktionen, gefolgt von Reinforcement Learning zur Verbesserung der Ausführungssicherheit bei komplexen Forschungsaufgaben.

28