← heapsort-ai

model migration

2 items

ARTICLEDEV.to AI·il y a 3h

Claude Fable 5 dropped this morning. By noon, 13 of my 31 production skills were quietly obsolete.

Un développeur raconte comment la sortie de Claude Fable 5 d'Anthropic a rendu 13 de ses 31 compétences d'IA en production obsolètes du jour au lendemain, en raison des changements dans les directives de prompt et le comportement de l'API. Les anciennes instructions dégradent désormais activement la qualité de la sortie du nouveau modèle, nécessitant une réévaluation complète de leur flotte d'agents autonomes.

62
RESEARCHarXiv CS.AI·01/05/2026

When Your LLM Reaches End-of-Life: A Framework for Confident Model Migration in Production Systems

Cette recherche présente un cadre pour la migration des systèmes LLM en production lorsque leurs modèles sous-jacents atteignent la fin de vie ou nécessitent un remplacement. Elle utilise une approche statistique bayésienne pour calibrer les métriques d'évaluation automatisées par rapport aux jugements humains, permettant une comparaison fiable des modèles avec des données manuelles limitées.

27