← heapsort-ai

information theory

15 items

RESEARCHarXiv CS.CL·18d atrás

PromptNCE: Pointwise Mutual Information Predictions Using Only LLMs and Contrastive Estimation Prompts

Este artigo apresenta o PromptNCE, um método para estimar a informação mútua pontual (PMI) usando apenas LLMs e prompts de estimativa contrastiva, superando a necessidade de críticos específicos da tarefa. Ele introduz um benchmark com PMI derivado de humanos e demonstra que o PromptNCE atinge correlação Spearman de até 0,82.

33
RESEARCHarXiv CS.CL·09/04/2026

The Stepwise Informativeness Assumption: Why are Entropy Dynamics and Reasoning Correlated in LLMs?

Este artigo investiga a correlação entre a dinâmica interna de entropia e o raciocínio correto em Large Language Models (LLMs), um enigma ainda sem solução. Propõe a Hipótese de Informatividade Gradual (SIA), que afirma que os modelos raciocinam corretamente ao acumular informações relevantes sobre a resposta por meio de prefixos informativos, um processo reforçado por métodos de treinamento padrão.

28
RESEARCHarXiv CS.AI·12d atrás

On the Origin of Synthetic Information by Means of Steganographic Inheritance

Este artigo de pesquisa postula a origem da informação sintética como um mistério central na ciência da informação, fazendo uma analogia com a origem das espécies. Propõe um mecanismo de herança esteganográfica para ajudar a rastrear a linhagem evolutiva da informação sintética gerada por IA, reconhecendo as implicações morais e os desafios técnicos.

28
RESEARCHarXiv CS.CL·16/04/2026

Bi-Predictability: A Real-Time Signal for Monitoring LLM Interaction Integrity

Este trabalho propõe a bi-predibilidade (P) e a arquitetura Information Digital Twin (IDT) para monitorar a integridade de interações de LLMs em tempo real. Isso permite assegurar a coerência estrutural contínua em fluxos de trabalho multi-turno, superando as limitações dos métodos de avaliação existentes que não detectam degradações graduais.

27
RESEARCHarXiv CS.LG·19d atrás

Neural Estimation of Pairwise Mutual Information in Masked Discrete Sequence Models

O artigo propõe uma estrutura neural para estimar a informação mútua condicional (MI) pareada diretamente dos estados ocultos de modelos de difusão mascarados (MDMs) pré-treinados. Este método captura estruturas de dependência e permite a decodificação paralela guiada por MI, demonstrando utilidade na geração de sequências de Sudoku e proteínas ao recuperar restrições estruturais.

27
RESEARCHarXiv CS.LG·04/05/2026

Information-Theoretic Generalization Bounds for Stochastic Gradient Descent with Predictable Virtual Noise

Este artigo introduz perturbações virtuais adaptativas ao histórico previsíveis para aprimorar os limites de generalização teórico-informacionais para o Gradiente Descendente Estocástico. Essa nova abordagem permite que as covariâncias de perturbação dependam dinamicamente do histórico passado do SGD, abordando as limitações dos métodos existentes que exigem covariâncias fixas.

27
RESEARCHarXiv CS.AI·21/04/2026

The Query Channel: Information-Theoretic Limits of Masking-Based Explanations

Este artigo formula métodos de explicação de IA baseados em mascaramento como comunicação através de um canal de consulta, onde as explicações são mensagens. Ele estabelece limites teóricos de informação para a recuperação de explicações exatas, demonstrando que a recuperação confiável é possível abaixo de uma certa capacidade.

27
ARTICLEDEV.to AI·11/04/2026

The Translation Loss

O texto aborda a longa história de comunicação indireta entre Estados Unidos e Irã, marcada por intermediários que introduziram distorções e interesses próprios. As atuais negociações em Islamabad representam uma tentativa pioneira de correção de erros e diálogo mais direto após décadas de 'perda na tradução'.

22