← heapsort-ai

representation learning

23 items

RESEARCHarXiv CS.LG·30/4/2026

Mini-Batch Class Composition Bias in Link Prediction

Esta investigación revela una heurística dependiente de mini-lotes en modelos populares de predicción de enlaces basados en GNNs, habilitada por capas de normalización por lotes. Este sesgo puede llevar a una sobreestimación de la capacidad de los modelos para aprender representaciones de grafos generalizadas, en lugar de transferir las propiedades subyacentes del grafo.

27
RESEARCHarXiv CS.CL·8/4/2026

The Illusion of Latent Generalization: Bi-directionality and the Reversal Curse

Este artigo aborda a 'maldição da reversão' em modelos de linguagem autorregressivos, onde falham ao recuperar fatos em ordem inversa. A pesquisa demonstra que a precisão da reversão exige um sinal de treinamento que torne a entidade de origem um alvo de previsão, indicando armazenamento separado para direções diretas e inversas, em vez de uma representação única e agnóstica à direção.

27
RESEARCHarXiv CS.AI·7/4/2026

TABQAWORLD: Optimizing Multimodal Reasoning for Multi-Turn Table Question Answering

TABQAWORLD é um novo framework para otimizar o raciocínio multimodal em perguntas e respostas sobre tabelas multi-turn. Ele aborda erros de representação e altos custos de inferência ao empregar uma política de seleção multimodal que alterna dinamicamente entre representações visuais e textuais para maximizar a confiabilidade do estado da tabela.

27