← heapsort-ai

content moderation

22 items

ARTICLE↑ trendingReddit r/LocalLLaMA·14/4/2026

Please stop using AI for posts and showcasing your completely vibe coded projects

El usuario expresa frustración por la abrumadora presencia de proyectos completamente codificados por IA y publicaciones generadas por IA con mínima intervención humana en una comunidad centrada en la IA. Argumenta que, si bien la asistencia de IA es aceptable, el sub no debería convertirse en un "sub de bazofia de IA" debido a la falta de contribución humana original.

53
RESEARCHarXiv CS.AI·hace 5d

Consensus is Strategically Insufficient: Reasoning-Trace Disagreement as a Knowledge-Representation Signal

Este artículo sostiene que reducir el desacuerdo en sistemas multiagente es insuficiente para tareas cargadas de valores, proponiendo una capa de representación del conocimiento. Esta capa abstrae las trazas de razonamiento y las decisiones de los agentes en estados simbólicos de desacuerdo, distinguiendo cuatro tipos, con aplicación en la moderación de contenido.

28
ARTICLEThe Verge AI·hace 5d

Let us filter AI slop, you cowards

Este artículo critica la proliferación de contenido generado por IA en las redes sociales y argumenta que las plataformas deberían permitir a los usuarios filtrar este tipo de "basura" de IA, más allá del simple etiquetado. Los esfuerzos actuales de etiquetado no han cambiado significativamente la forma en que se presenta el contenido en línea.

28
ARTICLEDEV.to AI·hace 17d

YouTube Just Made Every Creator a Deepfake Cop — Here's Why Investigators Should Be Nervous

Las herramientas ampliadas de YouTube para la detección de deepfakes transforman la verificación de medios sintéticos en un requisito de producción estándar, cambiando la carga de la prueba en las investigaciones digitales. Esta "democratización de la detección" implica que los indicadores de detección de similitud de las plataformas se convertirán en artefactos primarios en disputas legales y de seguros.

28
DOCAWS Machine Learning Blog·hace 22d

Prompting Amazon Nova 2 for content moderation

Esta publicación explica cómo usar Amazon Nova 2 Lite para la moderación de contenido mediante técnicas de prompting estructuradas y de forma libre. También compara las capacidades del modelo con varios modelos fundamentales en conjuntos de datos públicos, basado en el Estándar de Evaluación AILuminate de MLCommons.

27
ARTICLEDEV.to AI·25/4/2026

Fairness in Child Safety AI: Why Demographic Parity Audits Are Not Optional

Este artículo sostiene que la evaluación de la equidad, en particular la paridad demográfica, es una restricción de despliegue crítica e innegociable para los sistemas de IA en seguridad infantil. Ignorar esto perjudica a los usuarios, crea riesgos legales y socava la confianza, además de pasar por alto amenazas en grupos subrepresentados debido a datos sesgados.

27
ARTICLEDEV.to AI·20/4/2026

ModSense Moderation Intelligence System

ModSense es un sistema de inteligencia de moderación asistido por IA, un prototipo de grado de producción para grandes comunidades como Reddit. Combina detección de anomalías en tiempo real y modelado de la salud comunitaria basado en grafos con una capa de IA (Gemini 3 Flash) para identificar y responder a problemas como la toxicidad y la desinformación.

27
RESEARCHarXiv CS.AI·25/4/2026

Escaping the Agreement Trap: Defensibility Signals for Evaluating Rule-Governed AI

Este artículo presenta un nuevo marco para evaluar la IA gobernada por reglas, especialmente en la moderación de contenido, yendo más allá de las métricas de acuerdo simples. Propone el Defensibility Index (DI), Ambiguity Index (AI) y Probabilistic Defensibility Signal (PDS) para evaluar la corrección basada en políticas y la estabilidad del razonamiento, utilizando trazas de LLM para verificar la derivabilidad lógica de las reglas.

27