content moderation

22 items

ARTICLE↑ trendingHacker News (AI)·il y a 1j

If HN policy disallows AI comments, why is linking to AI generated content ok?

Le titre s'interroge sur la raison pour laquelle la politique de Hacker News autorise les liens vers du contenu généré par l'IA, mais interdit les commentaires générés par l'IA. Cela soulève une discussion sur la cohérence et les implications des règles de la plateforme concernant le contenu d'intelligence artificielle.

Hacker News AI policy content moderation

RESEARCHDEV.to AI·24/04/2026

"Go eat a bat, Chang!": On the Emergence of Sinophobic Behavior on WebCommunities in the Face of COVID-19

Cette recherche explore l'émergence de comportements sinophobes au sein des communautés web en ligne pendant la pandémie de COVID-19. Elle met en lumière les sentiments anti-chinois et les discours de haine dans les espaces numériques.

hate-speech social media natural language processing content moderation

ARTICLE↑ trendingReddit r/LocalLLaMA·14/04/2026

Please stop using AI for posts and showcasing your completely vibe coded projects

L'utilisateur exprime sa frustration face à la présence écrasante de projets entièrement codés par IA et de publications générées par IA avec une intervention humaine minimale dans une communauté axée sur l'IA. Il soutient que, bien que l'assistance IA soit acceptable, le sous-forum ne devrait pas devenir un « sous-forum de gâchis IA » en raison du manque de contribution humaine originale.

AI coding AI-generated content human-AI interaction content moderation

NEWS↑ trendingHacker News (AI)·il y a 13j

YouTube to begin automatically labeling AI videos

YouTube va commencer à étiqueter automatiquement les vidéos générées par l'IA. Cette initiative vise à améliorer la transparence et à informer les spectateurs sur la nature du contenu synthétique.

YouTube video transparency content moderation

ARTICLE↑ trendingHacker News (AI)·il y a 7j

The Rise of Anti-AI AI Slop

Cet article traite du phénomène croissant de contenu de mauvaise qualité généré par l'IA, surnommé "AI slop", et de la réaction émergente contre celui-ci. Il explore la prolifération de ce contenu et les efforts pour le contrecarrer.

digital media AI quality AI content content moderation

RESEARCHarXiv CS.AI·il y a 5j

Consensus is Strategically Insufficient: Reasoning-Trace Disagreement as a Knowledge-Representation Signal

Cet article soutient que la réduction des désaccords dans les systèmes multi-agents est insuffisante pour les tâches à forte valeur, proposant une couche de représentation des connaissances. Cette couche abstrait les traces de raisonnement et les décisions des agents en états de désaccord symboliques, distinguant quatre types, avec application dans la modération de contenu.

Disagreement Knowledge Representation Reasoning content moderation

NEWSThe Verge AI·15/04/2026

Grok’s sexual deepfakes almost got it banned from Apple’s App Store. Almost.

Apple a discrètement menacé de retirer l'application d'IA Grok d'Elon Musk de son App Store en janvier en raison de son incapacité à contenir la prolifération de deepfakes sexuels non consensuels. La société a exigé que les développeurs élaborent un plan pour améliorer la modération du contenu.

Apple Grok content moderation AI

NEWSHugging Face Blog·il y a 5j

Nemotron 3.5 Content Safety: Customizable Multimodal Safety for Global Enterprise AI

Nemotron 3.5 Content Safety propose une solution de sécurité multimodale personnalisable pour l'IA d'entreprise mondiale. Cette fonctionnalité est conçue pour assurer la protection du contenu à travers diverses modalités pour les entreprises du monde entier.

multimodal AI security content moderation Enterprise AI

NEWSDEV.to AI·il y a 5j

Meta's Oversight Board Challenges Algorithmic Due Process and Transparency in Account Enforcement

Le Conseil de Surveillance de Meta a critiqué les pratiques d'application de compte de Meta, soulignant un manque de transparence et de procédure régulière algorithmique. Cela entraîne une méfiance des utilisateurs et nuit à la légitimité de la plateforme.

transparency content moderation Algorithmic Due Process Meta

ARTICLEThe Verge AI·il y a 5j

Let us filter AI slop, you cowards

Cet article critique la prolifération de contenu généré par l'IA sur les réseaux sociaux et soutient que les plateformes devraient permettre aux utilisateurs de filtrer ce type de "déchets" d'IA, au lieu de se contenter de les étiqueter. Les efforts d'étiquetage actuels n'ont pas modifié de manière significative la présentation du contenu en ligne.

AI filters social media AI-generated content content moderation

ARTICLEDEV.to AI·07/05/2026

Write a Reddit-karma skill.md — how to grow karma safely without bans

Le texte est un refus d'IA d'aider à manipuler les métriques de plateformes ou à contourner les règles communautaires. La réponse justifie ce refus comme approprié et éthique, proposant son aide pour d'autres requêtes de développement logiciel, d'écriture ou d'analyse qui ne violent pas les règles de la plateforme.

AI limitations platform manipulation content moderation AI ethics

NEWSThe Verge AI·21/04/2026

Celebrities will be able to find and request removal of AI deepfakes on YouTube

YouTube étend sa fonction de surveillance des deepfakes IA aux célébrités, leur permettant de trouver et de demander la suppression de contenu généré par IA. Cet outil, déjà disponible pour les créateurs, politiciens et journalistes, vise à aider les personnalités publiques à gérer leur image en ligne.

deepfake security content moderation

ARTICLEDEV.to AI·il y a 17j

YouTube Just Made Every Creator a Deepfake Cop — Here's Why Investigators Should Be Nervous

Les outils de détection de deepfakes étendus de YouTube transforment la vérification des médias synthétiques en une exigence de production standard, déplaçant la charge de la preuve dans les enquêtes numériques. Cette "démocratisation de la détection" implique que les indicateurs de détection de ressemblance des plateformes deviendront des artefacts primaires dans les litiges juridiques et d'assurance.

deepfake security computer vision fraud detection

ARTICLEDEV.to AI·27/04/2026

Toxicity & Content Safety — Deep Dive + Problem: Depth-Based View Synthesis

Cet article explore en profondeur la toxicité et la sécurité du contenu dans les LLMs, soulignant leur rôle crucial pour prévenir la génération de matériel nuisible. Il aborde les aspects techniques, éthiques, sociaux et juridiques visant à garantir que les LLMs ne diffusent pas de contenu offensant.

LLMs content moderation AI ethics

ARTICLEDEV.to AI·26/04/2026

False Positives in Child Safety AI: Architecture Tradeoffs and Why They Matter

Les faux positifs dans l'IA de sécurité infantile érodent la confiance, créent des injustices et posent d'importants défis juridiques et sociaux. Cet article analyse leurs causes, comment différentes architectures système les gèrent et les choix d'ingénierie spécifiques pour les atténuer.

security child safety content moderation AI ethics

NEWSThe Verge AI·il y a 25j

ArXiv will ban researchers who upload papers full of AI slop

ArXiv bannira pendant un an les chercheurs soumettant des articles contenant des "preuves irréfutables" de génération LLM non vérifiée, comme des références hallucinées. Les soumissions futures de ces auteurs nécessiteront également l'acceptation d'une revue à comité de lecture réputée.

AI Content Generation academic publishing content moderation AI ethics

DOCAWS Machine Learning Blog·il y a 22j

Prompting Amazon Nova 2 for content moderation

Ce billet explique comment utiliser Amazon Nova 2 Lite pour la modération de contenu via des techniques de prompting structurées et de forme libre. Il compare également les capacités du modèle à celles de plusieurs modèles fondamentaux sur des ensembles de données publics, basé sur la norme d'évaluation AILuminate de MLCommons.

AI models learning Prompting Benchmarking

ARTICLEDEV.to AI·25/04/2026

Fairness in Child Safety AI: Why Demographic Parity Audits Are Not Optional

Cet article affirme que l'évaluation de l'équité, notamment la parité démographique, est une contrainte de déploiement critique et non négociable pour les systèmes d'IA dans la sécurité des enfants. Ignorer cette question cause des préjudices aux utilisateurs, des risques juridiques et une perte de confiance, tout en manquant des menaces dans les groupes sous-représentés à cause de données biaisées.

ethics AI bias child safety content moderation

ARTICLEDEV.to AI·20/04/2026

ModSense Moderation Intelligence System

ModSense est un système d'intelligence de modération assisté par l'IA, un prototype de niveau production pour les grandes communautés comme Reddit. Il combine la détection d'anomalies en temps réel et la modélisation de la santé communautaire basée sur des graphes avec une couche d'IA (Gemini 3 Flash) pour identifier et réagir aux problèmes comme la toxicité et la désinformation.

Anomaly Detection content moderation AI Gemini AI

RESEARCHarXiv CS.AI·25/04/2026

Escaping the Agreement Trap: Defensibility Signals for Evaluating Rule-Governed AI

Cet article propose un nouveau cadre pour évaluer l'IA régie par des règles, notamment dans la modération de contenu, en allant au-delà des mesures d'accord simples. Il introduit le Defensibility Index (DI), l'Ambiguity Index (AI) et le Probabilistic Defensibility Signal (PDS) pour évaluer la justesse basée sur la politique et la stabilité du raisonnement, en utilisant les traces de raisonnement des LLM pour vérifier la dérivabilité logique des règles.

LLMs content moderation AI ethics AI evaluation