← heapsort-ai

Statistics

5 items

ARTICLEDEV.to AI·18/4/2026

Statistics after the loss of innocence: New rigor in the age of AI

Este artículo analiza la evolución de la estadística en la era de la IA, abogando por un cambio hacia sistemas híbridos y tratando la estadística como una disciplina de ingeniería. Destaca la importancia de salvaguardar los ensayos clínicos, una infraestructura computacional robusta y nuevas directrices regulatorias como ICH E20 para gestionar los riesgos.

29
ARTICLEDEV.to AI·8/5/2026

Your AI Agent Evaluation Is Lying to You: Why 10 Test Runs Prove Nothing

El contenido argumenta que 10 pruebas entre agentes de IA son insuficientes para sacar conclusiones válidas sobre el rendimiento, incluso con un empate de 5-5. Explica que la tasa de victorias tiene intervalos de confianza enormes con tamaños de muestra pequeños, introduciendo el intervalo de puntuación de Wilson como un límite razonable para resultados binarios.

28
RESEARCHarXiv CS.LG·hace 17d

Double descent for least-squares interpolation on contaminated data: A simulation study

Esta investigación explora el fenómeno del "doble descenso" en modelos sobreparametrizados, que permite una mejor generalización a pesar de las preocupaciones clásicas de sobreajuste. El estudio examina específicamente este efecto en la regresión lineal con datos de entrenamiento contaminados, encontrando que una sobreparametrización significativa permite el doble descenso incluso en entornos robustos.

27