← heapsort-ai

information theory

15 items

RESEARCHarXiv CS.CL·hace 18d

PromptNCE: Pointwise Mutual Information Predictions Using Only LLMs and Contrastive Estimation Prompts

Este artículo presenta PromptNCE, un método para estimar la información mutua puntual (PMI) utilizando solo LLMs y prompts de estimación contrastiva, evitando la necesidad de críticos específicos de la tarea. Introduce un benchmark con PMI derivado de humanos y demuestra que PromptNCE logra una correlación de Spearman de hasta 0,82.

33
RESEARCHDEV.to AI·18/4/2026

Braille-D-FUMT8 vs CLIP / BERT / ImageBind: a Rigorous Information-Theoretic Comparison

Este artículo, una republicación del Rei-AIOS Paper 110, ofrece una rigurosa comparación informático-teórica entre la codificación Braille-Unicode × D-FUMT8 y esquemas de embedding multimodales como CLIP, BERT e ImageBind. La investigación explora la representación de 256 estados filosóficos en un solo carácter UTF-8 de 3 bytes.

29
RESEARCHarXiv CS.CL·9/4/2026

The Stepwise Informativeness Assumption: Why are Entropy Dynamics and Reasoning Correlated in LLMs?

Este artigo investiga a correlação entre a dinâmica interna de entropia e o raciocínio correto em Large Language Models (LLMs), um enigma ainda sem solução. Propõe a Hipótese de Informatividade Gradual (SIA), que afirma que os modelos raciocinam corretamente ao acumular informações relevantes sobre a resposta por meio de prefixos informativos, um processo reforçado por métodos de treinamento padrão.

28
RESEARCHarXiv CS.AI·hace 12d

On the Origin of Synthetic Information by Means of Steganographic Inheritance

Este artículo de investigación postula el origen de la información sintética como un misterio central en la ciencia de la información, estableciendo una analogía con el origen de las especies. Introduce un mecanismo de herencia esteganográfica para ayudar a rastrear el linaje evolutivo de la información sintética generada por IA, reconociendo las implicaciones morales y los desafíos técnicos.

28
RESEARCHarXiv CS.CL·16/4/2026

Bi-Predictability: A Real-Time Signal for Monitoring LLM Interaction Integrity

Este trabajo introduce la bi-predictibilidad (P) y la arquitectura Information Digital Twin (IDT) para monitorear en tiempo real la integridad de la interacción de LLMs. Esto permite asegurar la coherencia estructural continua en flujos de trabajo multi-turno, superando las limitaciones de los métodos de evaluación actuales que no detectan la degradación gradual.

27
RESEARCHarXiv CS.LG·hace 19d

Neural Estimation of Pairwise Mutual Information in Masked Discrete Sequence Models

El artículo propone un marco neural para estimar la información mutua condicional (MI) por pares directamente de los estados ocultos de modelos de difusión enmascarados (MDMs) preentrenados. Este método captura estructuras de dependencia y permite la decodificación paralela guiada por MI, mostrando su utilidad en la generación de secuencias de Sudoku y proteínas al recuperar restricciones estructurales.

27
RESEARCHarXiv CS.LG·4/5/2026

Information-Theoretic Generalization Bounds for Stochastic Gradient Descent with Predictable Virtual Noise

Este artículo introduce perturbaciones virtuales predecibles y adaptativas al historial para mejorar los límites de generalización teórico-informacionales para el Descenso de Gradiente Estocástico. Este nuevo enfoque permite que las covarianzas de perturbación dependan dinámicamente del historial pasado del SGD, abordando las limitaciones de los métodos existentes que requieren covarianzas fijas.

27
RESEARCHarXiv CS.AI·21/4/2026

The Query Channel: Information-Theoretic Limits of Masking-Based Explanations

Este artículo modela los métodos de explicación de IA basados en enmascaramiento como comunicación a través de un canal de consulta, donde las explicaciones son mensajes. Deriva límites teóricos de información para la recuperación de explicaciones exactas, mostrando que la recuperación confiable es alcanzable por debajo de cierta capacidad.

27