← heapsort-ai

model routing

9 items

RESEARCHarXiv CS.AI·07/04/2026

Explainable Model Routing for Agentic Workflows

Este conteúdo descreve o Topaz, um framework para roteamento auditável em fluxos de trabalho de agentes de IA. Ele visa resolver a falta de transparência na seleção de modelos, que atualmente prioriza custo e desempenho sem registrar as compensações subjacentes, utilizando perfis de habilidades e algoritmos de roteamento rastreáveis.

28
ARTICLEDEV.to AI·15/04/2026

I Built an LLM Gateway That Learns Which Model to Use — Here's How the Routing Works

Provara est une passerelle LLM qui achemine intelligemment les requêtes vers divers modèles d'IA (OpenAI, Anthropic, Google, etc.) via un point de terminaison compatible OpenAI. Elle utilise un LLM-juge pour noter les réponses, permettant au routeur d'apprendre et de sélectionner automatiquement le meilleur modèle pour une tâche donnée au fil du temps, sans configuration manuelle.

27
ARTICLEDEV.to AI·10/04/2026

Most of your Claude Code agents don't need Sonnet

O artigo apresenta uma estratégia de roteamento de 3 níveis para otimizar o custo de chamadas de agentes Claude Code, direcionando tarefas para o modelo de IA mais barato e adequado. O autor utiliza modelos caros como Sonnet apenas para tarefas que exigem raciocínio profundo, enquanto tarefas mais simples são atribuídas a modelos mais acessíveis como Haiku e Ollama.

25