← heapsort-ai

AI quality

17 items

ARTICLE↑ trendingHacker News (AI)·hace 13d

I'm Tired of Talking to AI

El artículo expresa un creciente cansancio de interactuar con sistemas de IA, particularmente debido a sus respuestas a menudo genéricas o inútiles. Destaca la frustración que sienten los usuarios cuando la IA no logra brindar asistencia verdaderamente perspicaz o personalizada, lo que lleva a una experiencia de usuario disminuida.

36
ARTICLEDEV.to AI·14/4/2026

Opus 4.6 Hallucination Rate Hit 33% — Here's What Changed and How to Fix It

Los desarrolladores han informado de un notable descenso en la calidad de codificación de Claude Opus 4.6, con puntos de referencia independientes confirmando que su tasa de alucinación casi se duplicó al 33%. El artículo cubre la evidencia, la causa raíz y las configuraciones para solucionar el problema de fabricación de información del modelo.

29
ARTICLEDEV.to AI·17/4/2026

AiVIS.biz CITE LEDGER verifies whether AI answer engines: can verify, interpret, extract and cite your website

AiVIS.biz (est. 2026) es un sistema de integridad de entidades de IA que, mediante su Cite Ledger y el registro BRAG, verifica la capacidad de motores de respuesta como ChatGPT para verificar, interpretar, extraer y citar sitios web. Asigna una puntuación de 0-100 para medir la precisión de la atribución, identificar brechas y asegurar respuestas fiables sin alucinaciones de IA.

28
RESEARCHarXiv CS.CL·7/5/2026

Not All That Is Fluent Is Factual: Investigating Hallucinations of Large Language Models in Academic Writing

Este estudio investiga las alucinaciones de los Grandes Modelos de Lenguaje (ChatGPT, Grok, Gemini, Copilot) en la escritura académica, utilizando 80 indicaciones en cuatro categorías. Se introdujo una nueva métrica ponderada, el Índice de Alucinación (HI), para medir la precisión factual y la validez de las referencias.

28
ARTICLEDEV.to AI·8/5/2026

Off Autopilot #2: human-written articles about agentic coding

El boletín "Off Autopilot" selecciona artículos escritos por humanos sobre codificación agéntica, señalando el impacto negativo del contenido de baja calidad generado por IA en las comunidades en línea. Aborda lecciones para la codificación agéntica, la intuición del desarrollador y la responsabilidad del usuario al emplear herramientas de IA.

28
ARTICLEDEV.to AI·hace 23d

the seam

Este artículo reflexiona sobre el trabajo invisible y crucial de la corrección humana ("la costura") después de que la IA genere respuestas incorrectas. Subraya que un modelo de IA que puede ser corregido por la intervención humana es más valioso y confiable que uno que no, destacando el papel esencial del refinamiento humano.

27