← heapsort-ai

Reproducibility

9 items

ARTICLEDEV.to AI·2d atrás

AgentUnit: Shipping AI like Software

AgentUnit aborda os desafios de implantação e gerenciamento de agentes de IA, introduzindo um padrão de empacotamento semelhante aos pacotes de software como rpm ou deb. Ele oferece disciplina em torno de identidade, contrato, governança e reprodutibilidade, transformando agentes em unidades auditáveis e prontas para produção.

36
RESEARCH↑ trendingReddit r/MachineLearning·05/05/2026

Struggling to reproduce paper results before improving them — stuck below reported accuracy [R]

Um estudante de doutorado em IA/visão computacional enfrenta dificuldades para reproduzir a precisão relatada em um artigo publicado, obtendo consistentemente cerca de 73% contra os 77% da linha de base do artigo. Apesar de verificações rigorosas e tentativas de contato com os autores, o estudante se depara com uma lacuna de reprodutibilidade que impede o avanço da pesquisa.

36
ARTICLE↑ trendingReddit r/MachineLearning·27/04/2026

Submitting to top ML Conferences without Sharing code [D]

Um pesquisador busca feedback sobre a suspensão do compartilhamento de código em submissões a conferências de ML, como NIPS, devido a preocupações com roubo de ideias. Ele sugere publicar o código apenas após a aceitação, destacando que outras partes da reprodutibilidade poderiam ser focadas, e que nem todos os revisores exigem o código.

35
RESEARCHDEV.to AI·07/05/2026

AI agent logs expose reproducibility gaps

Registros de agentes de IA expõem lacunas significativas de reprodutibilidade, onde agentes autônomos frequentemente falham mesmo após sucessos iniciais, especialmente em tarefas de navegação web. Pesquisas, como o corpus SWE-chat, mostram que menos da metade do código gerado por agentes é incorporado pelos usuários, evidenciando uma discrepância entre as pontuações de benchmark e a confiabilidade diária.

27
RESEARCHarXiv CS.AI·27/04/2026

An Artifact-based Agent Framework for Adaptive and Reproducible Medical Image Processing

Esta pesquisa apresenta uma estrutura de agente baseada em artefatos para aprimorar o processamento de imagens médicas, com foco em adaptabilidade e reprodutibilidade. O framework introduz uma camada semântica e um contrato de artefato para permitir a interrogação estruturada do fluxo de trabalho e a configuração condicionada por objetivos, atendendo às condições específicas do conjunto de dados.

27
RESEARCHarXiv CS.AI·27/04/2026

Read the Paper, Write the Code: Agentic Reproduction of Social-Science Results

Este trabalho apresenta um sistema de reprodução agentic que utiliza LLMs para replicar resultados de pesquisa em ciências sociais, partindo apenas da descrição dos métodos de um artigo e dos dados originais. O sistema avalia a capacidade de diferentes agentes e LLMs em 48 artigos, revelando que os resultados publicados podem ser recuperados, mas com variação de desempenho e erros atribuíveis a falhas do agente.

27
RESEARCHarXiv CS.AI·24d atrás

GraphBit: A Graph-based Agentic Framework for Non-Linear Agent Orchestration

Os frameworks de LLM agenticos que dependem de orquestração por prompts frequentemente sofrem de roteamento alucinatório e execução não reprodutível. GraphBit é uma estrutura orquestrada por um motor que define fluxos de trabalho de forma explícita e determinística como um grafo acíclico dirigido, garantindo reprodutibilidade e auditabilidade com um motor baseado em Rust e uma arquitetura de memória de três níveis.

27