← heapsort-ai

Statistics

5 items

ARTICLEDEV.to AI·18/04/2026

Statistics after the loss of innocence: New rigor in the age of AI

Cet article analyse l'évolution des statistiques à l'ère de l'IA, plaidant pour un passage aux systèmes hybrides et considérant les statistiques comme une discipline d'ingénierie. Il souligne l'importance de protéger les essais cliniques, d'une infrastructure informatique robuste et de nouvelles directives réglementaires comme l'ICH E20 pour gérer les risques.

29
ARTICLEDEV.to AI·08/05/2026

Your AI Agent Evaluation Is Lying to You: Why 10 Test Runs Prove Nothing

Le contenu soutient que 10 tests entre agents d'IA sont insuffisants pour tirer des conclusions valables sur la performance, même avec un match nul de 5-5. Il explique que le taux de victoire a des intervalles de confiance énormes avec de petites tailles d'échantillon, introduisant l'intervalle de score de Wilson comme une limite raisonnable pour les résultats binaires.

28
RESEARCHarXiv CS.LG·il y a 17j

Double descent for least-squares interpolation on contaminated data: A simulation study

Cette recherche examine le phénomène de la "double descente" dans les modèles surparamétrés, ce qui permet une meilleure généralisation malgré les préoccupations classiques de surapprentissage. L'étude explore spécifiquement cet effet dans la régression linéaire avec des données d'entraînement contaminées, constatant qu'une surparamétrisation importante permet la double descente même dans des contextes robustes.

27