← heapsort-ai

model routing

9 items

RESEARCHarXiv CS.AI·7/4/2026

Explainable Model Routing for Agentic Workflows

Este conteúdo descreve o Topaz, um framework para roteamento auditável em fluxos de trabalho de agentes de IA. Ele visa resolver a falta de transparência na seleção de modelos, que atualmente prioriza custo e desempenho sem registrar as compensações subjacentes, utilizando perfis de habilidades e algoritmos de roteamento rastreáveis.

28
ARTICLEDEV.to AI·15/4/2026

I Built an LLM Gateway That Learns Which Model to Use — Here's How the Routing Works

Provara es una pasarela LLM que enruta inteligentemente las solicitudes a varios modelos de IA (OpenAI, Anthropic, Google, etc.) a través de un endpoint compatible con OpenAI. Utiliza un LLM como juez para calificar las respuestas, lo que permite al enrutador aprender y seleccionar automáticamente el mejor modelo para una tarea determinada con el tiempo, sin configuración manual.

27
ARTICLEDEV.to AI·10/4/2026

Most of your Claude Code agents don't need Sonnet

O artigo apresenta uma estratégia de roteamento de 3 níveis para otimizar o custo de chamadas de agentes Claude Code, direcionando tarefas para o modelo de IA mais barato e adequado. O autor utiliza modelos caros como Sonnet apenas para tarefas que exigem raciocínio profundo, enquanto tarefas mais simples são atribuídas a modelos mais acessíveis como Haiku e Ollama.

25