information theory

15 items

ARTICLE3Blue1Brown (YouTube)·vor 2T

Reinventing Entropy | Compression & Intelligence Part 1

Dieser Artikel untersucht die Beziehung zwischen Entropie, Kompression und Intelligenz und ist der erste Teil einer Serie. Ziel ist es, das Verständnis dieser grundlegenden Konzepte neu zu definieren.

information theory intelligence AI compression

Reinventing Entropy | Compression & Intelligence Part 1

RESEARCHarXiv CS.CL·vor 18T

PromptNCE: Pointwise Mutual Information Predictions Using Only LLMs and Contrastive Estimation Prompts

Diese Arbeit stellt PromptNCE vor, eine Methode zur Schätzung der punktweisen gegenseitigen Information (PMI) unter Verwendung von nur LLMs und kontrastiven Schätzungsprompts, wodurch die Notwendigkeit aufgabenspezifischer Kritiker entfällt. Sie präsentiert einen Benchmark mit von Menschen abgeleiteter PMI und zeigt, dass PromptNCE eine Spearman-Korrelation von bis zu 0,82 erreicht.

information theory LLMs prompt engineering machine learning

RESEARCHDEV.to AI·vor 4T

Detection in the stochastic block model with multiple clusters: proof of theachievability conjectures, acyclic BP, and the infor

Dieses Papier untersucht die Detektion im stochastischen Blockmodell mit mehreren Clustern und liefert Beweise für Erreichbarkeitsvermutungen. Es behandelt auch azyklisches BP und informationstheoretische Aspekte des Modells.

information theory stochastic block model machine learning graph theory

RESEARCHDEV.to AI·4/18/2026

Braille-D-FUMT8 vs CLIP / BERT / ImageBind: a Rigorous Information-Theoretic Comparison

Dieser Artikel, eine Neuveröffentlichung des Rei-AIOS Papiers 110, präsentiert einen rigorosen informationstheoretischen Vergleich zwischen der Braille-Unicode × D-FUMT8 Kodierung und multimodalen Embedding-Schemata wie CLIP, BERT und ImageBind. Die Forschung untersucht die Darstellung von 256 philosophischen Zuständen innerhalb eines einzelnen 3-Byte UTF-8 Zeichens.

information theory AI models multimodal AI NLP

RESEARCHarXiv CS.CL·4/9/2026

The Stepwise Informativeness Assumption: Why are Entropy Dynamics and Reasoning Correlated in LLMs?

Este artigo investiga a correlação entre a dinâmica interna de entropia e o raciocínio correto em Large Language Models (LLMs), um enigma ainda sem solução. Propõe a Hipótese de Informatividade Gradual (SIA), que afirma que os modelos raciocinam corretamente ao acumular informações relevantes sobre a resposta por meio de prefixos informativos, um processo reforçado por métodos de treinamento padrão.

information theory LLMs machine learning Reasoning

RESEARCHarXiv CS.AI·vor 12T

On the Origin of Synthetic Information by Means of Steganographic Inheritance

Diese Forschungsarbeit postuliert den Ursprung synthetischer Informationen als ein zentrales Mysterium in der Informationswissenschaft, analog zur Entstehung der Arten. Sie schlägt einen steganografischen Vererbungsmechanismus vor, um die evolutionäre Abstammung KI-generierter synthetischer Informationen nachzuvollziehen, und berücksichtigt dabei die moralischen Implikationen und technischen Herausforderungen.

information theory synthetic data steganography AI ethics

RESEARCHarXiv CS.CL·4/16/2026

Bi-Predictability: A Real-Time Signal for Monitoring LLM Interaction Integrity

Dieses Papier stellt Bi-Prädiktierbarkeit (P) und die Information Digital Twin (IDT)-Architektur zur Echtzeitüberwachung der Integrität von LLM-Interaktionen vor. Ziel ist es, die strukturelle Kopplung in mehrstufigen Workflows kontinuierlich zu gewährleisten und die Mängel aktueller Bewertungsmethoden zu beheben, die eine schleichende Degradation nicht erkennen.

information theory monitoring evaluation real-time AI

RESEARCHDEV.to AI·4/26/2026

FIDT as a Domain-Specific Generator: A Honest Reframing of Fujimoto Infinite Dot Theory (Paper 140)

Dieser Artikel formuliert die Fujimoto Infinite Dot Theory (FIDT) von einem universellen Codec zu einem domänenspezifischen Generator für D-FUMT₈-Theorien um. In Zusammenarbeit mit Claude Opus 4.7 erreicht dieser Ansatz eine bytgenaue Rekonstruktion und hohe Kompression.

information theory research large language models compression

RESEARCHarXiv CS.LG·vor 19T

Neural Estimation of Pairwise Mutual Information in Masked Discrete Sequence Models

Die Arbeit schlägt einen neuronalen Rahmen zur Schätzung der paarweisen bedingten wechselseitigen Information (MI) direkt aus den verborgenen Zuständen vortrainierter maskierter Diffusionsmodelle (MDMs) vor. Diese Methode erfasst Abhängigkeitsstrukturen und ermöglicht eine MI-geführte parallele Dekodierung, was ihre Nützlichkeit bei der Sudoku- und Proteinsequenzgenerierung durch das Wiederherstellen struktureller Einschränkungen demonstriert.

neural networks information theory machine learning sequence models

RESEARCHarXiv CS.LG·5/4/2026

Information-Theoretic Generalization Bounds for Stochastic Gradient Descent with Predictable Virtual Noise

Dieser Artikel führt vorhersehbare, geschichtsadaptive virtuelle Störungen ein, um informations-theoretische Generalisierungsgrenzen für den Stochastischen Gradientenabstieg zu verbessern. Dieser neue Ansatz ermöglicht es den Störungkovarianzen, dynamisch von der früheren SGD-Historie abzuhängen, wodurch Einschränkungen bestehender Methoden, die feste Kovarianzen erfordern, behoben werden.

information theory Optimization Generalization machine learning

ARTICLEDEV.to AI·4/15/2026

Notes on Kullback-Leibler Divergence and Likelihood

Dieser Inhalt untersucht die Kullback-Leibler-Divergenz und ihre Beziehung zum Likelihood-Konzept. Es behandelt grundlegende Prinzipien der Informationstheorie und statistischen Inferenz, die für KI relevant sind.

information theory Likelihood Machine Learning Theory Kullback-Leibler Divergence

RESEARCHarXiv CS.AI·4/21/2026

The Query Channel: Information-Theoretic Limits of Masking-Based Explanations

Dieses Papier modelliert maskierungsbasierte KI-Erklärungsmethoden als Kommunikation über einen Anfragekanal, wobei Erklärungen Nachrichten sind. Es leitet informationstheoretische Grenzen für die Wiederherstellung exakter Erklärungen ab und zeigt, dass eine zuverlässige Wiederherstellung unterhalb einer bestimmten Kapazität möglich ist.

information theory AI models Explainability feature importance

DOCTowards Data Science·2/3/2025

Quantifying Uncertainty — A Data Scientist’s Intro To Information Theory — Part 2/5: Entropy

Dieser Inhalt vermittelt ein intuitives Verständnis von Entropie und ihren Anwendungen im Maschinellen Lernen und der Datenanalyse. Er enthält auch Python-Codebeispiele zur Erleichterung des Lernens.

information theory learning machine learning Data Analysis

DOCTowards Data Science·2/3/2025

Quantifying Surprise — A Data Scientist’s Intro To Information Theory — Part 1/5: Foundations

Dieser Inhalt bietet eine Einführung in die Informationstheorie mit Schwerpunkt auf deren Anwendungen im maschinellen Lernen und in der Datenanalyse. Python-Code ist zur Unterstützung des Verständnisses enthalten.

information theory learning machine learning Data Analysis

ARTICLEDEV.to AI·4/11/2026

The Translation Loss

Der Text beleuchtet die lange Geschichte indirekter und verzerrter Kommunikation zwischen den USA und dem Iran über Vermittler. Die aktuellen Verhandlungen in Islamabad stellen einen wegweisenden Versuch dar, durch direkten Dialog jahrzehntelangen "Übersetzungsverlust" zu korrigieren.

information theory diplomacy international relations Communication