← heapsort-ai

Prompt Caching

3 items

DOCDEV.to AI·10/05/2026

How to Save 90% on Claude API Input Costs With Prompt Caching (2026)

Ce contenu explique comment économiser jusqu'à 90% sur les coûts d'entrée de l'API Claude grâce à la fonction de mise en cache des invites d'Anthropic. Il aborde le problème du retraitement redondant des grandes invites système et détaille comment la mise en cache des préfixes stables réduit drastiquement les dépenses des requêtes ultérieures.

28
ARTICLEDEV.to AI·16/04/2026

Anthropic Silently Dropped Prompt Cache TTL from 1 Hour to 5 Minutes

L'article rapporte qu'Anthropic a discrètement réduit la durée de vie par défaut du cache de prompts de l'API Claude de 1 heure à 5 minutes le 6 mars 2026. Ce changement diminue considérablement les taux d'accès au cache pour la plupart des applications, entraînant une augmentation des coûts en raison du paiement intégral des jetons d'entrée à chaque requête.

27