RESEARCH↑ trendingReddit r/MachineLearning·15/4/2026
Was looking at a ICLR 2025 Oral paper and I am shocked it got oral [D]
Un usuario expresa su sorpresa con un artículo oral del ICLR 2025, criticando su metodología de evaluación para la generación de código SQL por LLMs. Según se informa, el artículo utilizó métricas de lenguaje natural en lugar de métricas de ejecución, lo que llevó a una tasa de falsos positivos de aproximadamente el 20%.
38