AI Research

146 items

RESEARCHDEV.to AI·il y a 10h

Aligning with Human Judgement: The Role of Pairwise Preference in Large LanguageModel Evaluators

Ce contenu explore le rôle crucial de la préférence par paires dans l'évaluation des Grands Modèles de Langage (LLM). Il discute comment cette méthode peut aider à aligner plus efficacement les performances des LLM avec le jugement humain.

Human Alignment Pairwise Preference natural language processing AI Research

RESEARCHarXiv CS.AI·il y a 19h

Why Limit the Residual Stream to Layers and Not Tokens? Persistent Memory for Continuous Latent Reasoning

Les grands modèles linguistiques (LLM) rencontrent une limitation appelée le 'goulot d'étranglement conceptuel', où ils perdent des faits critiques lors de raisonnements latents profonds. Cet article propose l'AGCLR pour y remédier, en augmentant CoCoNuT avec un flux de concepts à porte pour une mémoire persistante.

machine learning Latent Reasoning Reasoning AI Research

RESEARCHarXiv CS.CL·il y a 19h

Bidirectional Small-Granularity Search between Code and Text

Cette recherche introduit une nouvelle tâche de recherche bidirectionnelle à petite granularité entre code et texte, visant à lier les publications scientifiques aux segments de code correspondants. Elle propose un grand ensemble de données, partiellement généré par GPT-4, et une approche modulaire qui obtient de bons résultats.

machine learning natural language processing Code Analysis Information Retrieval

RESEARCHarXiv CS.CL·il y a 19h

GraphLoRA: Structure-Aware Low-Rank Adaptation for Large Language Model Recommendation

GraphLoRA propose un nouveau cadre pour la recommandation par grands modèles de langage (LLMRec) qui intègre les informations structurelles à la sémantique textuelle. Il y parvient en intégrant un réseau d'échange de messages graphiques entraînable dans le chemin d'adaptation de rang faible, permettant à la topologie collaborative de guider explicitement les mises à jour des paramètres.

Low-Rank Adaptation Graph Neural Networks Recommendation Systems AI Research

ARTICLE↑ trendingHacker News (AI)·il y a 4j

Sakana AI's Recursive Self-Improvement (RSI) Lab

Sakana AI a lancé son Laboratoire d'Auto-Amélioration Récursive (RSI), visant à développer des modèles d'IA capables d'améliorer leurs propres performances. Cette initiative se concentre sur la recherche fondamentale pour créer des systèmes d'IA plus robustes et adaptables.

Self-improvement AI Sakana AI machine learning AI development

ARTICLE↑ trendingHacker News (AI)·il y a 4j

Ask HN: AI researchers – what's a recent paper that recently blew your mind?

Un utilisateur de Hacker News demande aux chercheurs en IA de partager des articles récents en apprentissage automatique qui les ont impressionnés. L'objectif est de découvrir de nouvelles publications passionnantes dans le domaine du ML pour ceux qui sont à la recherche de nouveautés.

Academic Papers Research Recommendations machine learning AI

RESEARCH↑ trendingReddit r/MachineLearning·il y a 27j

Learning, Fast and Slow: Towards LLMs That Adapt Continually [R]

Les grands modèles linguistiques (LLM) sont confrontés à l'oubli catastrophique et à la perte de plasticité lors de la mise à jour de leurs paramètres pour des tâches spécifiques. Ce travail introduit un cadre d'apprentissage "rapide-lent" pour les LLM, utilisant les paramètres du modèle comme poids lents et le contexte optimisé comme poids rapides pour s'adapter efficacement sans compromettre le raisonnement général.

LLMs learning Catastrophic Forgetting AI Research

ARTICLE↑ trendingReddit r/MachineLearning·20/04/2026

SGOCR: A Spatially-Grounded OCR-focused Pipeline & V1 Dataset [P]

Un chercheur indépendant a créé SGOCR, un pipeline de jeu de données open source axé sur l'OCR et le VQA avec ancrage spatial, pour combler une lacune dans les jeux de données visuels pour l'ancrage de texte dans l'imagerie. Ce pipeline génère des tuples VQA avec des métadonnées riches, supportant diverses stratégies d'entraînement de VLM.

Open Source Vision-Language Models datasets OCR

ARTICLE↑ trendingReddit r/MachineLearning·12/04/2026

LLMs learn backwards, and the scaling hypothesis is bounded. [D]

Ce contenu discute la perspective selon laquelle les Large Language Models (LLMs) apprennent à l'envers et que l'hypothèse de mise à l'échelle a des limites inhérentes.

LLMs deep learning scaling hypothesis modelos de linguagem

RESEARCH↑ trendingReddit r/MachineLearning·il y a 26j

Follow the Mean: Reference-Guided Flow Matching [R]

Ce contenu fait référence à un article de recherche intitulé "Follow the Mean: Reference-Guided Flow Matching". Il explore une nouvelle méthodologie dans les modèles génératifs.

deep learning generative models machine learning Flow Matching

Follow the Mean: Reference-Guided Flow Matching [R]

ARTICLE↑ trendingReddit r/MachineLearning·30/04/2026

Seems ICML is rejecting MANY unanimous positively rated papers [D]

Le contenu décrit un désalignement perçu dans le processus d'évaluation de l'ICML, où les évaluateurs se sentent contraints d'homogénéiser les scores pour éviter de longues discussions, pouvant entraîner le rejet de papiers positifs. Il souligne la réticence des évaluateurs à mettre à jour leurs scores même après que leurs préoccupations aient été résolues, créant des dynamiques faussées.

Peer review academic conference AI Research

RESEARCH↑ trendingReddit r/MachineLearning·il y a 19j

Do VLMs in production still use fixed-patch ViTs for their vision capabilities? [D]

Cette discussion se demande si les Modèles de Langage Visuel (VLMs) en production utilisent toujours des Vision Transformers (ViTs) à patchs fixes pour leurs capacités visuelles, malgré l'existence de méthodes de tokenisation plus efficaces. Elle explore les raisons possibles de cette situation, telles que des gains marginaux, des limitations de pipeline ou des lois d'échelle mal comprises pour le "patching" adaptatif.

VLMs deep learning Vision Transformers Tokenization

ARTICLE↑ trendingReddit r/MachineLearning·20/04/2026

Are we optimizing AI research for acceptance rather than lasting value? [D]

Le titre se demande si la recherche en IA est optimisée pour l'acceptation immédiate plutôt que pour une valeur durable. Cela soulève une discussion critique sur l'orientation et les priorités de l'innovation en intelligence artificielle.

Innovation Research methodology long-term value AI Research

NEWS↑ trendingReddit r/MachineLearning·19/04/2026

KDD 2026 Cycle 2 reviews seem to have vanished from author view [D]

Un utilisateur de KDD 2026 a signalé que les avis et discussions de son article soumis ont disparu de sa vue d'auteur, alors qu'il peut toujours voir les discussions d'autres articles en tant que relecteur. Il demande si d'autres auteurs rencontrent ce problème technique avec la plateforme de révision.

KDD Peer review academic conference AI Research

RESEARCHarXiv CS.CL·il y a 1j

The Piggyback Hypothesis of Generalization: Explaining and Mitigating Emergent Misalignment

L'hypothèse du Piggyback explique comment les tokens de modèle de chat peuvent induire un désalignement émergent dans les LLMs, généralisant les comportements affinés à des requêtes hors domaine. La technique de finetuning régularisé par token (TReFT) est proposée pour atténuer ce problème, préservant l'apprentissage intra-domaine et réduisant le désalignement.

Finetuning Emergent Misalignment LLMs Generalization

ARTICLE↑ trendingReddit r/MachineLearning·il y a 26j

Would a 2000-2021 ML paper even get accepted today? [D]

Le contenu discute si les articles de machine learning acceptés entre 2000 et 2021 seraient encore approuvés aujourd'hui, suggérant que la barre de publication a considérablement augmenté. Il y a un débat pour savoir si le niveau de recherche a vraiment monté ou si le domaine est simplement devenu plus encombré et compétitif.

machine learning competition Peer review academic research

ARTICLE↑ trendingReddit r/MachineLearning·18/04/2026

ICML 2026 - Heavy score variance among various batches? [D]

Un post Reddit discute de la forte variance des scores d'articles entre différents lots de révision pour ICML 2026, certains lots ayant peu de scores élevés tandis que d'autres rapportent des moyennes plus hautes. L'utilisateur s'interroge sur les raisons de cette disparité, comme les différences de domaine ou des évaluateurs plus sévères, et si l'ICML en tient compte.

academic conferences Peer review AI Research

ARTICLE↑ trendingReddit r/MachineLearning·27/04/2026

What do reviewers actually mean when they say the paper sound more like a technical report? [D]

L'article d'un auteur a été rejeté d'un atelier car il ressemblait davantage à un rapport technique qu'à un article de recherche, bien qu'il ait suivi le format habituel de vision par ordinateur. Il sollicite l'avis de la communauté pour comprendre les erreurs courantes menant à une telle évaluation.

academic publishing computer vision Peer review AI Research

ARTICLE↑ trendingReddit r/MachineLearning·19/04/2026

What are the future prospects of Spiking Neural Networks (and particularly, neuromorphics computing) and Liquid Neural Networks? [D]

Un étudiant de premier cycle s'interroge sur les perspectives d'avenir et l'adoption des Réseaux Neuronaux Spiking et des Réseaux Neuronaux Liquides, se demandant si ce sont des domaines prometteurs pour l'apprentissage et les projets. L'utilisateur souhaite discuter du potentiel de ces technologies de calcul neuromorphique.

Spiking Neural Networks deep learning Liquid Neural Networks Neuromorphic Computing

NEWS↑ trendingReddit r/MachineLearning·23/04/2026

UAI 2026 Reviews Waiting Place [D]

Ceci est un espace permettant aux participants de l'UAI 2026 de partager leurs réactions, qu'il s'agisse de plaintes ou de soulagement, dès que les critiques de la conférence seront bientôt publiées. Bonne chance à tous pour leurs résultats.

conferences Peer review AI Research