← heapsort-ai

Anthropic API

2 items

ARTICLEDEV.to AI·il y a 15j

How I Cut My Anthropic API Bill by 50% With a Local Python Tool

L'auteur a considérablement réduit sa facture d'API Anthropic en développant un outil CLI local en Python nommé "ai-cost-optimizer". Cet outil utilise la mise en cache sémantique, la compression de prompts et le routage de modèles pour résoudre les problèmes courants tels que les requêtes répétées, les prompts volumineux et l'utilisation de modèles d'IA trop chers pour des tâches simples.

30
ARTICLEDEV.to AI·il y a 25j

Anthropic API in production: 5 things the docs don't tell you

Cet article souligne les coûts cachés de la mise en cache avec l'API Anthropic en production, en particulier lors de l'utilisation d'expériences A/B avec des invites système randomisées. Il explique que les écritures de cache sont plus coûteuses que les lectures et conseille de placer les variations A/B dans `messages[]` au lieu des invites `system` pour optimiser les coûts.

28