← heapsort-ai

machine learning training

1 items

RESEARCHarXiv CS.LG·23/04/2026

DR-Venus: Towards Frontier Edge-Scale Deep Research Agents with Only 10K Open Data

DR-Venus apresenta um agente de pesquisa profunda de 4B para implantação em escala de borda, treinado eficazmente com apenas 10K dados abertos. O processo inclui ajuste fino supervisionado para capacidades básicas e aprendizagem por reforço para melhorar a confiabilidade em tarefas de pesquisa de longo prazo, otimizando a qualidade e utilização dos dados.

28