← heapsort-ai

content moderation

22 items

ARTICLE↑ trendingReddit r/LocalLLaMA·14/04/2026

Please stop using AI for posts and showcasing your completely vibe coded projects

L'utilisateur exprime sa frustration face à la présence écrasante de projets entièrement codés par IA et de publications générées par IA avec une intervention humaine minimale dans une communauté axée sur l'IA. Il soutient que, bien que l'assistance IA soit acceptable, le sous-forum ne devrait pas devenir un « sous-forum de gâchis IA » en raison du manque de contribution humaine originale.

53
RESEARCHarXiv CS.AI·il y a 5j

Consensus is Strategically Insufficient: Reasoning-Trace Disagreement as a Knowledge-Representation Signal

Cet article soutient que la réduction des désaccords dans les systèmes multi-agents est insuffisante pour les tâches à forte valeur, proposant une couche de représentation des connaissances. Cette couche abstrait les traces de raisonnement et les décisions des agents en états de désaccord symboliques, distinguant quatre types, avec application dans la modération de contenu.

28
ARTICLEThe Verge AI·il y a 5j

Let us filter AI slop, you cowards

Cet article critique la prolifération de contenu généré par l'IA sur les réseaux sociaux et soutient que les plateformes devraient permettre aux utilisateurs de filtrer ce type de "déchets" d'IA, au lieu de se contenter de les étiqueter. Les efforts d'étiquetage actuels n'ont pas modifié de manière significative la présentation du contenu en ligne.

28
ARTICLEDEV.to AI·il y a 17j

YouTube Just Made Every Creator a Deepfake Cop — Here's Why Investigators Should Be Nervous

Les outils de détection de deepfakes étendus de YouTube transforment la vérification des médias synthétiques en une exigence de production standard, déplaçant la charge de la preuve dans les enquêtes numériques. Cette "démocratisation de la détection" implique que les indicateurs de détection de ressemblance des plateformes deviendront des artefacts primaires dans les litiges juridiques et d'assurance.

28
DOCAWS Machine Learning Blog·il y a 22j

Prompting Amazon Nova 2 for content moderation

Ce billet explique comment utiliser Amazon Nova 2 Lite pour la modération de contenu via des techniques de prompting structurées et de forme libre. Il compare également les capacités du modèle à celles de plusieurs modèles fondamentaux sur des ensembles de données publics, basé sur la norme d'évaluation AILuminate de MLCommons.

27
ARTICLEDEV.to AI·25/04/2026

Fairness in Child Safety AI: Why Demographic Parity Audits Are Not Optional

Cet article affirme que l'évaluation de l'équité, notamment la parité démographique, est une contrainte de déploiement critique et non négociable pour les systèmes d'IA dans la sécurité des enfants. Ignorer cette question cause des préjudices aux utilisateurs, des risques juridiques et une perte de confiance, tout en manquant des menaces dans les groupes sous-représentés à cause de données biaisées.

27
ARTICLEDEV.to AI·20/04/2026

ModSense Moderation Intelligence System

ModSense est un système d'intelligence de modération assisté par l'IA, un prototype de niveau production pour les grandes communautés comme Reddit. Il combine la détection d'anomalies en temps réel et la modélisation de la santé communautaire basée sur des graphes avec une couche d'IA (Gemini 3 Flash) pour identifier et réagir aux problèmes comme la toxicité et la désinformation.

27
RESEARCHarXiv CS.AI·25/04/2026

Escaping the Agreement Trap: Defensibility Signals for Evaluating Rule-Governed AI

Cet article propose un nouveau cadre pour évaluer l'IA régie par des règles, notamment dans la modération de contenu, en allant au-delà des mesures d'accord simples. Il introduit le Defensibility Index (DI), l'Ambiguity Index (AI) et le Probabilistic Defensibility Signal (PDS) pour évaluer la justesse basée sur la politique et la stabilité du raisonnement, en utilisant les traces de raisonnement des LLM pour vérifier la dérivabilité logique des règles.

27