← heapsort-ai

information theory

15 items

RESEARCHarXiv CS.CL·vor 18T

PromptNCE: Pointwise Mutual Information Predictions Using Only LLMs and Contrastive Estimation Prompts

Diese Arbeit stellt PromptNCE vor, eine Methode zur Schätzung der punktweisen gegenseitigen Information (PMI) unter Verwendung von nur LLMs und kontrastiven Schätzungsprompts, wodurch die Notwendigkeit aufgabenspezifischer Kritiker entfällt. Sie präsentiert einen Benchmark mit von Menschen abgeleiteter PMI und zeigt, dass PromptNCE eine Spearman-Korrelation von bis zu 0,82 erreicht.

33
RESEARCHDEV.to AI·4/18/2026

Braille-D-FUMT8 vs CLIP / BERT / ImageBind: a Rigorous Information-Theoretic Comparison

Dieser Artikel, eine Neuveröffentlichung des Rei-AIOS Papiers 110, präsentiert einen rigorosen informationstheoretischen Vergleich zwischen der Braille-Unicode × D-FUMT8 Kodierung und multimodalen Embedding-Schemata wie CLIP, BERT und ImageBind. Die Forschung untersucht die Darstellung von 256 philosophischen Zuständen innerhalb eines einzelnen 3-Byte UTF-8 Zeichens.

29
RESEARCHarXiv CS.CL·4/9/2026

The Stepwise Informativeness Assumption: Why are Entropy Dynamics and Reasoning Correlated in LLMs?

Este artigo investiga a correlação entre a dinâmica interna de entropia e o raciocínio correto em Large Language Models (LLMs), um enigma ainda sem solução. Propõe a Hipótese de Informatividade Gradual (SIA), que afirma que os modelos raciocinam corretamente ao acumular informações relevantes sobre a resposta por meio de prefixos informativos, um processo reforçado por métodos de treinamento padrão.

28
RESEARCHarXiv CS.AI·vor 12T

On the Origin of Synthetic Information by Means of Steganographic Inheritance

Diese Forschungsarbeit postuliert den Ursprung synthetischer Informationen als ein zentrales Mysterium in der Informationswissenschaft, analog zur Entstehung der Arten. Sie schlägt einen steganografischen Vererbungsmechanismus vor, um die evolutionäre Abstammung KI-generierter synthetischer Informationen nachzuvollziehen, und berücksichtigt dabei die moralischen Implikationen und technischen Herausforderungen.

28
RESEARCHarXiv CS.CL·4/16/2026

Bi-Predictability: A Real-Time Signal for Monitoring LLM Interaction Integrity

Dieses Papier stellt Bi-Prädiktierbarkeit (P) und die Information Digital Twin (IDT)-Architektur zur Echtzeitüberwachung der Integrität von LLM-Interaktionen vor. Ziel ist es, die strukturelle Kopplung in mehrstufigen Workflows kontinuierlich zu gewährleisten und die Mängel aktueller Bewertungsmethoden zu beheben, die eine schleichende Degradation nicht erkennen.

27
RESEARCHarXiv CS.LG·vor 19T

Neural Estimation of Pairwise Mutual Information in Masked Discrete Sequence Models

Die Arbeit schlägt einen neuronalen Rahmen zur Schätzung der paarweisen bedingten wechselseitigen Information (MI) direkt aus den verborgenen Zuständen vortrainierter maskierter Diffusionsmodelle (MDMs) vor. Diese Methode erfasst Abhängigkeitsstrukturen und ermöglicht eine MI-geführte parallele Dekodierung, was ihre Nützlichkeit bei der Sudoku- und Proteinsequenzgenerierung durch das Wiederherstellen struktureller Einschränkungen demonstriert.

27
RESEARCHarXiv CS.LG·5/4/2026

Information-Theoretic Generalization Bounds for Stochastic Gradient Descent with Predictable Virtual Noise

Dieser Artikel führt vorhersehbare, geschichtsadaptive virtuelle Störungen ein, um informations-theoretische Generalisierungsgrenzen für den Stochastischen Gradientenabstieg zu verbessern. Dieser neue Ansatz ermöglicht es den Störungkovarianzen, dynamisch von der früheren SGD-Historie abzuhängen, wodurch Einschränkungen bestehender Methoden, die feste Kovarianzen erfordern, behoben werden.

27
RESEARCHarXiv CS.AI·4/21/2026

The Query Channel: Information-Theoretic Limits of Masking-Based Explanations

Dieses Papier modelliert maskierungsbasierte KI-Erklärungsmethoden als Kommunikation über einen Anfragekanal, wobei Erklärungen Nachrichten sind. Es leitet informationstheoretische Grenzen für die Wiederherstellung exakter Erklärungen ab und zeigt, dass eine zuverlässige Wiederherstellung unterhalb einer bestimmten Kapazität möglich ist.

27