heapsort-ai — Notícias, Artigos e Pesquisas de IA

RESEARCHarXiv CS.CL·08/04/2026

This Treatment Works, Right? Evaluating LLM Sensitivity to Patient Question Framing in Medical QA

Este estudo de pesquisa avalia a sensibilidade de Grandes Modelos de Linguagem (LLMs) à forma como as perguntas de pacientes são formuladas em cenários de QA médica. Usando um ambiente RAG controlado, a pesquisa investiga como o enquadramento (positivo vs. negativo) e o estilo da linguagem afetam a consistência das respostas dos LLMs.

prompt-engineering RAG linguagem natural medical QA

RESEARCHarXiv CS.AI·08/04/2026

Proximity Measure of Information Object Features for Solving the Problem of Their Identification in Information Systems

Este artigo propõe uma nova medida de proximidade quantitativa e qualitativa para características de objetos de informação, provenientes de múltiplas fontes. O objetivo é identificar se esses objetos se referem ao mesmo objeto físico, considerando erros de determinação e sem exigir a transformação dos valores das características para comparabilidade.

proximity measure quantitative analysis feature identification Information Systems

RESEARCHarXiv CS.AI·08/04/2026

PaperOrchestra: A Multi-Agent Framework for Automated AI Research Paper Writing

PaperOrchestra é um framework multiagente para escrita automatizada de artigos de pesquisa em IA, transformando materiais brutos em manuscritos LaTeX com síntese de literatura e visuais. Avaliado com o novo benchmark PaperWritingBench, ele supera significativamente as linhas de base autônomas em avaliações humanas.

Literature Synthesis Scientific Discovery PaperOrchestra Multi-Agent Framework

RESEARCHarXiv CS.AI·08/04/2026

Uncertainty-Guided Latent Diagnostic Trajectory Learning for Sequential Clinical Diagnosis

Este artigo aborda o desafio do diagnóstico clínico sequencial sob incerteza, onde a maioria dos sistemas baseados em LLMs não modela a aquisição progressiva de evidências. Os autores propõem o framework Latent Diagnostic Trajectory Learning (LDTL), utilizando agentes LLM para planejamento e diagnóstico, tratando sequências de ações como caminhos latentes.

Diagnóstico Clínico Aprendizado Sequencial Trajetória Latente Incerteza

RESEARCHarXiv CS.AI·08/04/2026

ReVEL: Multi-Turn Reflective LLM-Guided Heuristic Evolution via Structured Performance Feedback

ReVEL propõe um framework híbrido que integra LLMs como raciocinadores multi-turno dentro de algoritmos evolutivos para evoluir heurísticas eficazes para problemas de otimização NP-difíceis. O método utiliza agrupamento de perfis de desempenho e reflexão guiada por feedback para que o LLM analise comportamentos e gere refinamentos direcionados.

Otimização Combinatória Inteligência Artificial Algoritmos Evolutivos Heurísticas

RESEARCHarXiv CS.CL·08/04/2026

The Illusion of Latent Generalization: Bi-directionality and the Reversal Curse

Este artigo aborda a 'maldição da reversão' em modelos de linguagem autorregressivos, onde falham ao recuperar fatos em ordem inversa. A pesquisa demonstra que a precisão da reversão exige um sinal de treinamento que torne a entidade de origem um alvo de previsão, indicando armazenamento separado para direções diretas e inversas, em vez de uma representação única e agnóstica à direção.

LLMs NLP bidirectional models representation learning

RESEARCHarXiv CS.AI·08/04/2026

Pramana: Fine-Tuning Large Language Models for Epistemic Reasoning through Navya-Nyaya

Grandes modelos de linguagem (LLMs) falham em raciocínio sistemático e frequentemente alucinam, expondo uma lacuna epistêmica. Pramana é uma nova abordagem que ensina metodologia epistemológica explícita a LLMs, através de fine-tuning na lógica Navya-Nyaya, um framework de raciocínio indiano milenar.

Epistemic Reasoning hallucination large language models fine-tuning

RESEARCHarXiv CS.CL·08/04/2026

Memory Dial: A Training Framework for Controllable Memorization in Language Models

Memory Dial é um framework de treinamento que permite controlar a memorização em modelos de linguagem de forma explícita. Ele utiliza um parâmetro $\alpha$ para ajustar a pressão de memorização, aumentando a acurácia em exemplos vistos sem impactar a acurácia em exemplos não vistos.

language models controllability machine learning memorization

RESEARCHarXiv CS.AI·08/04/2026

MMORF: A Multi-agent Framework for Designing Multi-objective Retrosynthesis Planning Systems

Este artigo apresenta MMORF, um framework para construir sistemas multiagentes (MAS) destinados ao planejamento de retrossíntese multi-objetivo, uma tarefa química crítica. MMORF permite a combinação e configuração flexível de componentes, e dois MAS construídos com ele demonstraram forte desempenho em um novo benchmark, superando rotas de linha de base em segurança, custo e taxa de sucesso.

language models AI frameworks Retrosynthesis multi-agent systems

RESEARCHarXiv CS.AI·08/04/2026

MedGemma 1.5 Technical Report

O MedGemma 1.5 4B é um novo modelo que expande as capacidades do MedGemma 1, integrando análise de imagens médicas de alta dimensão (CT/MRI, histopatologia), localização anatômica e compreensão de documentos médicos. Ele demonstra ganhos significativos em precisão de classificação de condições em MRI e CT, e um aumento de 47% no macro F1 para imagens de patologia de lâmina inteira.

deep learning AI healthcare AI Medical Imaging

RESEARCHarXiv CS.LG·08/04/2026

Energy-Based Dynamical Models for Neurocomputation, Learning, and Optimization

Este artigo explora avanços em sistemas dinâmicos para computação, inspirados na neurociência, com o objetivo de melhorar a escalabilidade, robustez e eficiência energética em IA. O foco está em modelos dinâmicos baseados em energia, como redes de Hopfield e máquinas de Boltzmann, que codificam informações através de fluxos de gradiente.

neurocomputation hopfield networks machine learning energy-based models

RESEARCHarXiv CS.LG·08/04/2026

Cactus: Accelerating Auto-Regressive Decoding with Constrained Acceptance Speculative Sampling

Este trabalho propõe o Cactus, um novo método para acelerar a decodificação auto-regressiva de LLMs através de amostragem especulativa com aceitação restrita. Ele resolve as limitações de abordagens anteriores, garantindo uma divergência controlada da distribuição do verificador por meio de uma formulação de otimização restrita.

Cactus constrained optimization auto-regressive decoding speculative sampling

RESEARCHarXiv CS.CL·08/04/2026

Multilingual Language Models Encode Script Over Linguistic Structure

Este estudo investiga como modelos de linguagem multilíngues, como Llama-3.2-1B e Gemma-2-2B, organizam suas representações internas para idiomas diversos. Os pesquisadores descobriram que essas representações são fortemente condicionadas pela ortografia, e não pela identidade linguística abstrata, com a romanização gerando representações distintas.

Representações de Linguagem Modelos de Linguagem Multilíngues Llama Ortografia

RESEARCHarXiv CS.LG·08/04/2026

Learning Stable Predictors from Weak Supervision under Distribution Shift

Este artigo de pesquisa formaliza o 'supervision drift' em experimentos CRISPR-Cas13d, analisando a robustez de modelos sob shift de distribuição, inclusive quando o mecanismo de supervisão muda. Utilizando um benchmark não-IID, demonstra bom desempenho in-domain, mas falha na transferência temporal e apenas sucesso parcial na transferência entre linhagens celulares.

robustness distribution shift Transfer Learning machine learning

RESEARCHarXiv CS.CL·08/04/2026

MegaTrain: Full Precision Training of 100B+ Parameter Large Language Models on a Single GPU

MegaTrain é um sistema focado em memória que permite o treinamento eficiente de modelos de linguagem grandes com mais de 100 bilhões de parâmetros em precisão total em uma única GPU. Ele armazena parâmetros na memória do host e utiliza otimizações como um motor de execução pipeline e templates de camada sem estado para superar gargalos de largura de banda e maximizar a utilização da GPU.

Single GPU Training Memory Optimization GPU Acceleration large language models

RESEARCHarXiv CS.LG·08/04/2026

Prune-Quantize-Distill: An Ordered Pipeline for Efficient Neural Network Compression

Este artigo propõe um pipeline ordenado (poda, quantização INT8 e destilação de conhecimento) para otimizar a compressão de redes neurais, visando a latência de inferência medida em vez de métricas indiretas. A pesquisa revela que a quantização INT8 oferece o principal benefício de tempo de execução, enquanto a poda atua como um pré-condicionador e a destilação de conhecimento recupera a precisão.

Pruning Knowledge Distillation model efficiency Neural Network Compression

RESEARCHarXiv CS.LG·08/04/2026

A Theory-guided Weighted $L^2$ Loss for solving the BGK model via Physics-informed neural networks

Este artigo propõe uma função de perda L2 ponderada pela velocidade para resolver o modelo Bhatnagar-Gross-Krook (BGK) usando Redes Neurais Informadas pela Física (PINNs), superando as limitações da perda L2 padrão. A nova abordagem garante a convergência da solução aproximada e demonstra maior precisão e robustez em experimentos numéricos.

Physics-Informed Neural Networks Weighted L2 loss BGK model partial differential equations

RESEARCHarXiv CS.LG·08/04/2026

Territory Paint Wars: Diagnosing and Mitigating Failure Modes in Competitive Multi-Agent PPO

Este trabalho apresenta o ambiente Territory Paint Wars para investigar modos de falha do PPO em aprendizado por reforço multiagente competitivo. Ele identifica falhas de implementação que causam baixo desempenho e, após a correção, revela um novo problema de overfitting competitivo que prejudica a generalização.

failure modes reinforcement learning self-play PPO

RESEARCHarXiv CS.AI·08/04/2026

Algebraic Structure Discovery for Real World Combinatorial Optimisation Problems: A General Framework from Abstract Algebra to Quotient Space Learning

O conteúdo apresenta um framework geral para identificar estruturas algébricas em problemas de otimização combinatória, visando reduzir o espaço de busca e melhorar a descoberta da solução ótima global. Ele formaliza operações e constrói espaços quociente para otimizar sobre representações reduzidas, com aplicações em tarefas de combinação de regras usando algoritmos genéticos.

Rule-Based Systems Combinatorial Optimisation Quotient Space Learning Genetic Algorithms

RESEARCHarXiv CS.AI·08/04/2026

Part-Level 3D Gaussian Vehicle Generation with Joint and Hinge Axis Estimation

Este trabalho propõe um framework generativo para sintetizar veículos 3D Gaussianos animáveis a partir de uma única imagem ou entradas multi-view esparsas. Ele visa superar as limitações dos modelos de veículos rígidos atuais em simulações de direção autônoma, introduzindo um módulo de refinamento para articulação de partes.

computer vision autonomous driving 3D Generation Vehicle Simulation