← heapsort-ai

model routing

9 items

RESEARCHarXiv CS.AI·4/7/2026

Explainable Model Routing for Agentic Workflows

Este conteúdo descreve o Topaz, um framework para roteamento auditável em fluxos de trabalho de agentes de IA. Ele visa resolver a falta de transparência na seleção de modelos, que atualmente prioriza custo e desempenho sem registrar as compensações subjacentes, utilizando perfis de habilidades e algoritmos de roteamento rastreáveis.

28
ARTICLEDEV.to AI·4/15/2026

I Built an LLM Gateway That Learns Which Model to Use — Here's How the Routing Works

Provara ist ein LLM-Gateway, das Anfragen intelligent an verschiedene KI-Modelle (OpenAI, Anthropic, Google usw.) über einen OpenAI-kompatiblen Endpunkt weiterleitet. Es nutzt ein LLM als „Richter“ zur Bewertung von Antworten, wodurch der Router lernt und über die Zeit automatisch das beste Modell für eine gegebene Aufgabe auswählt, was eine manuelle Konfiguration überflüssig macht.

27
ARTICLEDEV.to AI·4/10/2026

Most of your Claude Code agents don't need Sonnet

O artigo apresenta uma estratégia de roteamento de 3 níveis para otimizar o custo de chamadas de agentes Claude Code, direcionando tarefas para o modelo de IA mais barato e adequado. O autor utiliza modelos caros como Sonnet apenas para tarefas que exigem raciocínio profundo, enquanto tarefas mais simples são atribuídas a modelos mais acessíveis como Haiku e Ollama.

25