← heapsort-ai

deep learning

263 items

RESEARCHarXiv CS.LG·il y a 14j

Iterative Refinement Neural Operators are Learned Fixed-Point Solvers: A Principled Approach to Spectral Bias Mitigation

Cet article introduit l'Opérateur Neuronal de Raffinement Itératif (IRNO) pour atténuer le biais spectral dans les opérateurs neuronaux, en utilisant un module de raffinement appris via l'itération de point fixe. L'IRNO décompose les prédictions en une initialisation grossière suivie de corrections résiduelles successives, réalisant une réduction significative des erreurs dans les systèmes physiques.

28
RESEARCHarXiv CS.AI·il y a 4j

An interpretable and trustworthy AI framework for large-scale longitudinal structure-pain association studies using data from the Osteoarthritis Initiative (OAI)

Cette recherche développe un cadre d'IA interprétable combinant la prédiction du score MOAKS par IRM basée sur l'apprentissage profond avec la modélisation statistique pour étudier les relations structure-douleur à grande échelle en utilisant les données de l'OAI. Elle utilise l'apprentissage profond pour la prédiction des caractéristiques MOAKS à partir d'IRM avec quantification de l'incertitude, puis un modèle mixte de classe latente longitudinale pour examiner les associations entre les anomalies structurelles et la douleur au genou.

28
RESEARCHarXiv CS.CL·il y a 4j

Multi-Granularity Reasoning for Natural Language Inference

L'article propose un nouveau Réseau de Raisonnement Multi-Granularité (MGRN) pour l'Inférence en Langage Naturel (NLI). Il aborde les limites des modèles existants basés sur des transformateurs en exploitant des caractéristiques sémantiques hiérarchiques pour capturer des interactions complexes et un raisonnement efficace.

28
RESEARCHarXiv CS.LG·06/04/2026

From Broad Exploration to Stable Synthesis: Entropy-Guided Optimization for Autoregressive Image Generation

O artigo analisa a interação entre Chain-of-Thought (CoT) e Reinforcement Learning (RL) na geração de imagens a partir de texto (T2I) usando uma análise sistemática baseada em entropia. Ele revela que menor entropia dos tokens de imagem e do CoT textual se correlaciona com melhor qualidade de imagem, propondo a estratégia Entropy-Guided Group Relative Policy Optimization (EG-GRPO) para otimização com base na incerteza.

28
DOCDEV.to AI·17/04/2026

Understanding Transformers Part 9: Stacking Self-Attention Layers

Cet article explique pourquoi les valeurs d'auto-attention remplacent les encodages positionnels originaux, car elles intègrent des informations contextuelles de tous les mots, clarifiant les relations. Il introduit ensuite l'empilement de plusieurs couches d'auto-attention, chacune avec des poids uniques, pour capturer des relations linguistiques plus complexes au sein des phrases et des paragraphes.

28
RESEARCHDEV.to AI·19/04/2026

F-VLM: Open-Vocabulary Object Detection upon Frozen Vision and Language Models

F-VLM propose une nouvelle approche pour la détection d'objets à vocabulaire ouvert, en tirant parti de manière efficace des modèles de vision et de langage pré-entraînés et figés. Cette méthode permet d'identifier un large éventail d'objets sans nécessiter de données d'entraînement spécifiques pour chaque nouvelle catégorie.

28
ARTICLEDEV.to AI·il y a 27j

Comparing AI Approaches for Trade Promotion Strategies in Automotive

Le texte souligne que la "promotion commerciale par IA" englobe un éventail d'approches, des systèmes basés sur des règles à l'apprentissage profond. Les constructeurs automobiles doivent évaluer ces méthodologies en fonction de compromis tels que la précision, la complexité et la maturité des données, de manière similaire au choix des configurations de capteurs ADAS.

28
RESEARCHarXiv CS.LG·07/05/2026

Investigating Trustworthiness of Nonparametric Deep Survival Models for Alzheimer's Disease Progression Analysis

Cette recherche examine la fiabilité et l'équité des modèles de survie profonde non paramétriques pour analyser la progression de la maladie d'Alzheimer (MA). Elle aborde le manque d'études prenant en compte les biais appris dans les modèles d'apprentissage profond pour la MA et propose de nouvelles métriques d'équité pour des prédictions fiables.

28
RESEARCHarXiv CS.LG·il y a 6j

Graph Mamba Survival Analysis Based on Topology-Aware ordering

Cet article aborde les défis de l'analyse de survie des Images de Lames Entières (WSIs), en particulier le goulot d'étranglement computationnel des Transformers et la sensibilité de Mamba à l'ordre d'entrée ainsi que son architecture unidirectionnelle. Il propose une nouvelle approche pour surmonter les limitations de Mamba dans la capture de la connectivité topologique et des structures spatiales bidirectionnelles.

28
RESEARCHarXiv CS.LG·17/04/2026

Awakening Dormant Experts:Counterfactual Routing to Mitigate MoE Hallucinations

Les modèles Mixture-of-Experts (MoE) sont sujets aux hallucinations, surtout avec les connaissances à longue traîne, car le routage Top-k statique sous-priorise les experts spécialistes. Le routage contrefactuel (CoR) est proposé comme un cadre d'inférence sans entraînement qui utilise l'analyse de perturbation et le CEI pour déplacer dynamiquement les ressources de calcul, réveillant ainsi ces experts dormants.

28
RESEARCHarXiv CS.LG·il y a 15j

Reading Calibrated Uncertainty from Language Model Trajectories

Cet article de recherche propose une nouvelle méthode pour quantifier l'incertitude dans les modèles de langage en traçant le chemin cumulatif des mises à jour MLP par couche. En extrayant onze caractéristiques géométriques invariantes à l'échelle, une sonde linéaire clairsemée surpasse la probabilité maximale de softmax dans l'évaluation de l'incertitude.

28