← heapsort-ai

AI Research

146 items

RESEARCHarXiv CS.AI·il y a 19h

Why Limit the Residual Stream to Layers and Not Tokens? Persistent Memory for Continuous Latent Reasoning

Les grands modèles linguistiques (LLM) rencontrent une limitation appelée le 'goulot d'étranglement conceptuel', où ils perdent des faits critiques lors de raisonnements latents profonds. Cet article propose l'AGCLR pour y remédier, en augmentant CoCoNuT avec un flux de concepts à porte pour une mémoire persistante.

57
RESEARCHarXiv CS.CL·il y a 19h

Bidirectional Small-Granularity Search between Code and Text

Cette recherche introduit une nouvelle tâche de recherche bidirectionnelle à petite granularité entre code et texte, visant à lier les publications scientifiques aux segments de code correspondants. Elle propose un grand ensemble de données, partiellement généré par GPT-4, et une approche modulaire qui obtient de bons résultats.

54
RESEARCHarXiv CS.CL·il y a 19h

GraphLoRA: Structure-Aware Low-Rank Adaptation for Large Language Model Recommendation

GraphLoRA propose un nouveau cadre pour la recommandation par grands modèles de langage (LLMRec) qui intègre les informations structurelles à la sémantique textuelle. Il y parvient en intégrant un réseau d'échange de messages graphiques entraînable dans le chemin d'adaptation de rang faible, permettant à la topologie collaborative de guider explicitement les mises à jour des paramètres.

54
RESEARCH↑ trendingReddit r/MachineLearning·il y a 27j

Learning, Fast and Slow: Towards LLMs That Adapt Continually [R]

Les grands modèles linguistiques (LLM) sont confrontés à l'oubli catastrophique et à la perte de plasticité lors de la mise à jour de leurs paramètres pour des tâches spécifiques. Ce travail introduit un cadre d'apprentissage "rapide-lent" pour les LLM, utilisant les paramètres du modèle comme poids lents et le contexte optimisé comme poids rapides pour s'adapter efficacement sans compromettre le raisonnement général.

42
ARTICLE↑ trendingReddit r/MachineLearning·20/04/2026

SGOCR: A Spatially-Grounded OCR-focused Pipeline & V1 Dataset [P]

Un chercheur indépendant a créé SGOCR, un pipeline de jeu de données open source axé sur l'OCR et le VQA avec ancrage spatial, pour combler une lacune dans les jeux de données visuels pour l'ancrage de texte dans l'imagerie. Ce pipeline génère des tuples VQA avec des métadonnées riches, supportant diverses stratégies d'entraînement de VLM.

42
ARTICLE↑ trendingReddit r/MachineLearning·30/04/2026

Seems ICML is rejecting MANY unanimous positively rated papers [D]

Le contenu décrit un désalignement perçu dans le processus d'évaluation de l'ICML, où les évaluateurs se sentent contraints d'homogénéiser les scores pour éviter de longues discussions, pouvant entraîner le rejet de papiers positifs. Il souligne la réticence des évaluateurs à mettre à jour leurs scores même après que leurs préoccupations aient été résolues, créant des dynamiques faussées.

42
RESEARCH↑ trendingReddit r/MachineLearning·il y a 19j

Do VLMs in production still use fixed-patch ViTs for their vision capabilities? [D]

Cette discussion se demande si les Modèles de Langage Visuel (VLMs) en production utilisent toujours des Vision Transformers (ViTs) à patchs fixes pour leurs capacités visuelles, malgré l'existence de méthodes de tokenisation plus efficaces. Elle explore les raisons possibles de cette situation, telles que des gains marginaux, des limitations de pipeline ou des lois d'échelle mal comprises pour le "patching" adaptatif.

42
RESEARCHarXiv CS.CL·il y a 1j

The Piggyback Hypothesis of Generalization: Explaining and Mitigating Emergent Misalignment

L'hypothèse du Piggyback explique comment les tokens de modèle de chat peuvent induire un désalignement émergent dans les LLMs, généralisant les comportements affinés à des requêtes hors domaine. La technique de finetuning régularisé par token (TReFT) est proposée pour atténuer ce problème, préservant l'apprentissage intra-domaine et réduisant le désalignement.

41
ARTICLE↑ trendingReddit r/MachineLearning·il y a 26j

Would a 2000-2021 ML paper even get accepted today? [D]

Le contenu discute si les articles de machine learning acceptés entre 2000 et 2021 seraient encore approuvés aujourd'hui, suggérant que la barre de publication a considérablement augmenté. Il y a un débat pour savoir si le niveau de recherche a vraiment monté ou si le domaine est simplement devenu plus encombré et compétitif.

41
ARTICLE↑ trendingReddit r/MachineLearning·18/04/2026

ICML 2026 - Heavy score variance among various batches? [D]

Un post Reddit discute de la forte variance des scores d'articles entre différents lots de révision pour ICML 2026, certains lots ayant peu de scores élevés tandis que d'autres rapportent des moyennes plus hautes. L'utilisateur s'interroge sur les raisons de cette disparité, comme les différences de domaine ou des évaluateurs plus sévères, et si l'ICML en tient compte.

41
ARTICLE↑ trendingReddit r/MachineLearning·27/04/2026

What do reviewers actually mean when they say the paper sound more like a technical report? [D]

L'article d'un auteur a été rejeté d'un atelier car il ressemblait davantage à un rapport technique qu'à un article de recherche, bien qu'il ait suivi le format habituel de vision par ordinateur. Il sollicite l'avis de la communauté pour comprendre les erreurs courantes menant à une telle évaluation.

38
ARTICLE↑ trendingReddit r/MachineLearning·19/04/2026

What are the future prospects of Spiking Neural Networks (and particularly, neuromorphics computing) and Liquid Neural Networks? [D]

Un étudiant de premier cycle s'interroge sur les perspectives d'avenir et l'adoption des Réseaux Neuronaux Spiking et des Réseaux Neuronaux Liquides, se demandant si ce sont des domaines prometteurs pour l'apprentissage et les projets. L'utilisateur souhaite discuter du potentiel de ces technologies de calcul neuromorphique.

38
NEWS↑ trendingReddit r/MachineLearning·23/04/2026

UAI 2026 Reviews Waiting Place [D]

Ceci est un espace permettant aux participants de l'UAI 2026 de partager leurs réactions, qu'il s'agisse de plaintes ou de soulagement, dès que les critiques de la conférence seront bientôt publiées. Bonne chance à tous pour leurs résultats.

37