LLM Evaluation for Indie Hackers: Build a £0.20/Run System That Catches Real Bugs
Este contenido enseña a los indie hackers cómo construir un sistema de evaluación de LLM de bajo costo (£0.20/ejecución) para detectar errores reales en producción. El sistema utiliza un conjunto de datos dorado, un LLM para puntuar las salidas y una puerta CI para bloquear fusiones.