← heapsort-ai

model routing

9 items

RESEARCHarXiv CS.AI·07/04/2026

Explainable Model Routing for Agentic Workflows

Este conteúdo descreve o Topaz, um framework para roteamento auditável em fluxos de trabalho de agentes de IA. Ele visa resolver a falta de transparência na seleção de modelos, que atualmente prioriza custo e desempenho sem registrar as compensações subjacentes, utilizando perfis de habilidades e algoritmos de roteamento rastreáveis.

28
ARTICLEDEV.to AI·15/04/2026

I Built an LLM Gateway That Learns Which Model to Use — Here's How the Routing Works

A Provara é um gateway LLM que roteia inteligentemente requisições para diversos modelos de IA, incluindo OpenAI, Anthropic e Google, através de um endpoint compatível com OpenAI. O sistema usa um LLM-como-juiz para avaliar as respostas, permitindo que o roteador aprenda e selecione automaticamente o melhor modelo para cada tarefa, sem necessidade de configuração manual.

27
ARTICLEDEV.to AI·10/04/2026

Most of your Claude Code agents don't need Sonnet

O artigo apresenta uma estratégia de roteamento de 3 níveis para otimizar o custo de chamadas de agentes Claude Code, direcionando tarefas para o modelo de IA mais barato e adequado. O autor utiliza modelos caros como Sonnet apenas para tarefas que exigem raciocínio profundo, enquanto tarefas mais simples são atribuídas a modelos mais acessíveis como Haiku e Ollama.

25