information theory

15 items

ARTICLE3Blue1Brown (YouTube)·2d atrás

Reinventing Entropy | Compression & Intelligence Part 1

Este artigo explora a relação entre entropia, compressão e inteligência, sendo a primeira parte de uma série. O objetivo é redefinir o entendimento desses conceitos fundamentais.

information theory intelligence AI compression

Reinventing Entropy | Compression & Intelligence Part 1

RESEARCHarXiv CS.CL·18d atrás

PromptNCE: Pointwise Mutual Information Predictions Using Only LLMs and Contrastive Estimation Prompts

Este artigo apresenta o PromptNCE, um método para estimar a informação mútua pontual (PMI) usando apenas LLMs e prompts de estimativa contrastiva, superando a necessidade de críticos específicos da tarefa. Ele introduz um benchmark com PMI derivado de humanos e demonstra que o PromptNCE atinge correlação Spearman de até 0,82.

information theory LLMs prompt engineering machine learning

RESEARCHDEV.to AI·4d atrás

Detection in the stochastic block model with multiple clusters: proof of theachievability conjectures, acyclic BP, and the infor

Este documento explora a detecção no modelo de blocos estocásticos com múltiplos clusters, fornecendo provas para as conjecturas de alcançabilidade. Ele também aborda o processamento BP acíclico e os aspectos informacionais do modelo.

information theory stochastic block model machine learning graph theory

RESEARCHDEV.to AI·18/04/2026

Braille-D-FUMT8 vs CLIP / BERT / ImageBind: a Rigorous Information-Theoretic Comparison

Este artigo, uma republicação do Rei-AIOS Paper 110, apresenta uma comparação rigorosa e informacional entre a codificação Braille-Unicode × D-FUMT8 e esquemas de embedding multimodais como CLIP, BERT e ImageBind. A pesquisa explora a representação de 256 estados filosóficos em um único caractere UTF-8 de 3 bytes.

information theory AI models multimodal AI NLP

RESEARCHarXiv CS.CL·09/04/2026

The Stepwise Informativeness Assumption: Why are Entropy Dynamics and Reasoning Correlated in LLMs?

Este artigo investiga a correlação entre a dinâmica interna de entropia e o raciocínio correto em Large Language Models (LLMs), um enigma ainda sem solução. Propõe a Hipótese de Informatividade Gradual (SIA), que afirma que os modelos raciocinam corretamente ao acumular informações relevantes sobre a resposta por meio de prefixos informativos, um processo reforçado por métodos de treinamento padrão.

information theory LLMs machine learning Reasoning

RESEARCHarXiv CS.AI·12d atrás

On the Origin of Synthetic Information by Means of Steganographic Inheritance

Este artigo de pesquisa postula a origem da informação sintética como um mistério central na ciência da informação, fazendo uma analogia com a origem das espécies. Propõe um mecanismo de herança esteganográfica para ajudar a rastrear a linhagem evolutiva da informação sintética gerada por IA, reconhecendo as implicações morais e os desafios técnicos.

information theory synthetic data steganography AI ethics

RESEARCHarXiv CS.CL·16/04/2026

Bi-Predictability: A Real-Time Signal for Monitoring LLM Interaction Integrity

Este trabalho propõe a bi-predibilidade (P) e a arquitetura Information Digital Twin (IDT) para monitorar a integridade de interações de LLMs em tempo real. Isso permite assegurar a coerência estrutural contínua em fluxos de trabalho multi-turno, superando as limitações dos métodos de avaliação existentes que não detectam degradações graduais.

information theory monitoring evaluation real-time AI

RESEARCHDEV.to AI·26/04/2026

FIDT as a Domain-Specific Generator: A Honest Reframing of Fujimoto Infinite Dot Theory (Paper 140)

Este artigo reformula a Teoria do Ponto Infinito de Fujimoto (FIDT) de um codec universal para um gerador específico de domínio para teorias D-FUMT₈. Desenvolvido com a colaboração de Claude Opus 4.7, este reframing permite a reconstrução exata de bytes e alta compressão.

information theory research large language models compression

RESEARCHarXiv CS.LG·19d atrás

Neural Estimation of Pairwise Mutual Information in Masked Discrete Sequence Models

O artigo propõe uma estrutura neural para estimar a informação mútua condicional (MI) pareada diretamente dos estados ocultos de modelos de difusão mascarados (MDMs) pré-treinados. Este método captura estruturas de dependência e permite a decodificação paralela guiada por MI, demonstrando utilidade na geração de sequências de Sudoku e proteínas ao recuperar restrições estruturais.

neural networks information theory machine learning sequence models

RESEARCHarXiv CS.LG·04/05/2026

Information-Theoretic Generalization Bounds for Stochastic Gradient Descent with Predictable Virtual Noise

Este artigo introduz perturbações virtuais adaptativas ao histórico previsíveis para aprimorar os limites de generalização teórico-informacionais para o Gradiente Descendente Estocástico. Essa nova abordagem permite que as covariâncias de perturbação dependam dinamicamente do histórico passado do SGD, abordando as limitações dos métodos existentes que exigem covariâncias fixas.

information theory Optimization Generalization machine learning

ARTICLEDEV.to AI·15/04/2026

Notes on Kullback-Leibler Divergence and Likelihood

Este conteúdo explora as notas sobre a divergência de Kullback-Leibler e sua relação com o conceito de verossimilhança. Aborda princípios fundamentais da teoria da informação e inferência estatística relevantes para a IA.

information theory Likelihood Machine Learning Theory Kullback-Leibler Divergence

RESEARCHarXiv CS.AI·21/04/2026

The Query Channel: Information-Theoretic Limits of Masking-Based Explanations

Este artigo formula métodos de explicação de IA baseados em mascaramento como comunicação através de um canal de consulta, onde as explicações são mensagens. Ele estabelece limites teóricos de informação para a recuperação de explicações exatas, demonstrando que a recuperação confiável é possível abaixo de uma certa capacidade.

information theory AI models Explainability feature importance

DOCTowards Data Science·03/02/2025

Quantifying Uncertainty — A Data Scientist’s Intro To Information Theory — Part 2/5: Entropy

Este conteúdo oferece uma compreensão intuitiva da Entropia e suas aplicações em Machine Learning e Análise de Dados. Ele também inclui exemplos de código Python para facilitar o aprendizado.

information theory learning machine learning Data Analysis

DOCTowards Data Science·03/02/2025

Quantifying Surprise — A Data Scientist’s Intro To Information Theory — Part 1/5: Foundations

Este conteúdo oferece uma introdução à Teoria da Informação, com foco em suas aplicações em Aprendizado de Máquina e Análise de Dados. Inclui código Python para facilitar a compreensão.

information theory learning machine learning Data Analysis

ARTICLEDEV.to AI·11/04/2026

The Translation Loss

O texto aborda a longa história de comunicação indireta entre Estados Unidos e Irã, marcada por intermediários que introduziram distorções e interesses próprios. As atuais negociações em Islamabad representam uma tentativa pioneira de correção de erros e diálogo mais direto após décadas de 'perda na tradução'.

information theory diplomacy international relations Communication