bias detection

2 items

RESEARCHarXiv CS.CL·4/23/2026

Can We Locate and Prevent Stereotypes in LLMs?

Diese Studie untersucht, wo Stereotypen in LLMs wie GPT 2 Small und Llama 3.2 lokalisiert sind. Sie erforscht die Identifizierung einzelner neuronaler Aktivierungen und Attention Heads, um „Bias-Fingerabdrücke“ zu kartieren und erste Einblicke zur Minderung zu liefern.

neural networks LLMs bias detection Bias Mitigation

ARTICLEDEV.to AI·4/27/2026

Building Smart Fairness Analyzer: An AI-Powered Bias Detection App with MongoDB & NLP

Dieses Projekt stellt den Smart Fairness Analyzer vor, eine Plattform, die entwickelt wurde, um Geschlechts-, Rassen-, Alters- und sozioökonomische Verzerrungen in KI-Antworten in Echtzeit zu erkennen und zu prüfen. Das Tool verwendet akademische ML-Fairness-Metriken und speichert vollständige Prüfpfade in MongoDB zur Analyse.

ethics bias detection machine learning AI fairness