heapsort
RESEARCH27

UCCI: Calibrated Uncertainty for Cost-Optimal LLM Cascade Routing

arXiv CS.LG·20 mai 2026

UCCI est un routeur innovant qui utilise l'incertitude calibrée pour optimiser le coût des cascades de LLM, en envoyant les requêtes faciles à de petits modèles et les difficiles à de grands modèles. Il réduit le coût d'inférence de 31% sur les charges de travail en production tout en maintenant la précision, en calibrant la confiance du modèle.

Lire l'original