← heapsort-ai

API usage

4 items

ARTICLEDEV.to AI·il y a 25j

Anthropic API in production: 5 things the docs don't tell you

Cet article souligne les coûts cachés de la mise en cache avec l'API Anthropic en production, en particulier lors de l'utilisation d'expériences A/B avec des invites système randomisées. Il explique que les écritures de cache sont plus coûteuses que les lectures et conseille de placer les variations A/B dans `messages[]` au lieu des invites `system` pour optimiser les coûts.

28
ARTICLEDEV.to AI·11/04/2026

What I Learned After 6 Months of Obsessively Tracking My AI Costs

L'auteur a suivi les coûts des API d'IA pendant six mois et a découvert que les dépenses étaient liées à de mauvaises habitudes d'utilisation, telles que des sessions longues avec de grandes fenêtres de contexte. La leçon principale est que la durée de la conversation augmente exponentiellement les coûts, surtout lorsque le contexte n'est pas géré.

24