AI Research

146 items

ARTICLE↑ trendingReddit r/MachineLearning·17/04/2026

SIGIR-AP: Good conference for IR? [D]

Un chercheur universitaire intéressé par la Recherche d'Information (RI) demande conseil sur des conférences académiques moins compétitives pour soumettre son travail. Il s'interroge sur la qualité de SIGIR-AP, une nouvelle conférence soutenue par SIGIR, et sollicite d'autres suggestions.

research academic conferences Information Retrieval AI Research

ARTICLE↑ trendingReddit r/MachineLearning·11/04/2026

Post Rebuttal ICML Average Scores? [D]

Un auteur exprime sa frustration face au processus d'évaluation de l'ICML, soulignant un score moyen de 3.5 et le changement d'évaluation d'un relecteur. Il note qu'un score de 4.2, d'après le "Paper Co-Pilot", ne classe un article que dans le top 40%.

Academic Publication Paper Co-Pilot paper review ICML

ARTICLE↑ trendingReddit r/MachineLearning·20/04/2026

Does submitting to only journals negatively affect research career after finishing PhD? [D]

Le contenu se demande si la publication exclusive dans des revues de ML (par exemple TMLR, JMLR) plutôt que lors de conférences nuit aux perspectives d'emploi pour des postes de chercheur scientifique en ML en entreprise, compte tenu de la perception de processus de révision plus équitables dans les revues. La discussion porte sur les carrières en entreprise après le doctorat.

hiring AI Research

NEWS↑ trendingReddit r/MachineLearning·12/04/2026

"There's a new generation of empirical deep learning researchers, hacking away at whatever seems trendy, blowing with the wind" [D]

Le contenu critique la nouvelle génération de chercheurs en deep learning pour suivre les tendances. L'auteur cherche à discuter du terme complexe « IA post-agentique », avec lequel il rencontre des difficultés.

AI trends deep learning post-agentic AI AI concepts

ARTICLE↑ trendingReddit r/MachineLearning·21/04/2026

[NeurIPS 2026] Will you be submitting your code alongside your submissions? [D]

Ce contenu discute de la soumission de code avec les articles pour NeurIPS 2026, l'auteur étant partagé entre le gain de crédibilité et les préoccupations concernant le plagiat. Le message sollicite les avis de la communauté sur cette pratique.

code submission academic-ethics plagiarism research integrity

ARTICLE↑ trendingReddit r/MachineLearning·16/04/2026

[ICML 2026] Scores increased and then decreased!! [D]

Un auteur d'article pour l'ICML s'inquiète car un évaluateur a augmenté son score après la réplique, mais l'a ensuite réduit à nouveau au score initial. La diminution du score moyen de l'article lui fait craindre un rejet anticipé.

Peer review academic conference AI Research

ARTICLE↑ trendingReddit r/MachineLearning·01/05/2026

ICML 2026 Position Track Decision [D]

L'utilisateur propose de créer un fil de discussion séparé pour la 'position track' d'ICML 2026, craignant que les discussions sur cette section de niche ne soient noyées dans le fil principal. Le but est de faciliter les décisions concernant cette piste spécifique.

machine learning academic discourse Conference AI Research

ARTICLE↑ trendingReddit r/MachineLearning·13/04/2026

[ICML 2026] Extending the deadline for reviewer final justifications while not extending for Author-AC comments was a huge mistake [D]

L'auteur critique la décision de prolonger le délai des justifications finales des relecteurs de l'ICML 2026 sans prolonger celui des contacts auteurs-ACs, jugeant cela une grave erreur. Un relecteur a soulevé de nouvelles questions critiques dans sa justification finale, non mentionnées auparavant, ce qui pourrait compromettre un article ayant par ailleurs de bonnes évaluations.

deadlines ICML Peer review academic conference

RESEARCHarXiv CS.CL·22/04/2026

Remask, Don't Replace: Token-to-Mask Refinement in Masked Diffusion Language Models

Cet article propose une nouvelle technique, le remasking Token-to-Mask (T2M), pour affiner les modèles de langage de diffusion masqués tels que LLaDA2.1. Cette méthode corrige les lacunes de l'édition Token-to-Token (T2T) en réinitialisant les jetons suspects à un état de masque pour une reprediction plus précise.

Diffusion Models language models error correction Natural Language Processing

RESEARCHarXiv CS.CL·il y a 14j

Multi-Persona Debate System for Automated Scientific Hypothesis Generation

Le Système de Débat Multi-Persona (MPDS) est un cadre basé sur la littérature pour la génération automatisée d'hypothèses scientifiques, visant à surmonter le défi de synthétiser des connaissances fragmentées, notamment dans la recherche sur les matériaux de batterie. Il intègre la récupération de littérature, le raisonnement de grands modèles linguistiques et le débat multi-agents, permettant la négociation entre personas tout en préservant la traçabilité des preuves.

Materials Science Scientific Discovery multi-agent systems AI Research

RESEARCHDEV.to AI·18/04/2026

Density-aware Chamfer Distance as a Comprehensive Metric for Point CloudCompletion

Ce contenu présente la "Density-aware Chamfer Distance" comme une nouvelle métrique complète pour l'évaluation des tâches de complétion de nuages de points. Elle vise à offrir une évaluation plus robuste et précise des modèles 3D complétés.

3D reconstruction point cloud Metrics computer vision

RESEARCHarXiv CS.CL·23/04/2026

Do Hallucination Neurons Generalize? Evidence from Cross-Domain Transfer in LLMs

Une nouvelle recherche indique que les « neurones d'hallucination » (H-neurons) prédisant les hallucinations des LLM ne se généralisent pas entre différents domaines de connaissance. Cela suggère que l'hallucination pourrait ne pas être un mécanisme unique avec une signature neurale universelle, mais plutôt dépendante du contexte.

LLMs hallucination AI safety AI Research

RESEARCHDEV.to AI·13/04/2026

Beyond the 80/20 Rule: High-Entropy Minority Tokens Drive EffectiveReinforcement Learning for LLM Reasoning

Ce contenu explore une nouvelle approche pour améliorer l'apprentissage par renforcement pour le raisonnement des grands modèles de langage (LLM) en se concentrant sur les « jetons minoritaires à haute entropie ». Il suggère que ces jetons moins fréquents mais très informatifs sont les principaux moteurs d'un apprentissage efficace, défiant la règle conventionnelle 80/20.

Token Analysis reinforcement learning Natural Language Processing LLM reasoning

RESEARCHarXiv CS.CL·il y a 13j

Self-Verified Distillation: Your Language Model Is Secretly Its Own Synthetic Data Pipeline

Cette recherche introduit la Distillation Auto-Vérifiée, un algorithme permettant aux grands modèles de langage (LLM) de s'améliorer en utilisant uniquement des invites non étiquetées. Le processus implique la génération, l'auto-vérification par des contrôles multi-étapes, puis l'entraînement sur des ensembles de données auto-curés, sans enseignants externes.

distillation learning self-training AI Research

RESEARCHarXiv CS.CL·il y a 19j

Data Scaling as Progressive Coverage of a Predictive Contribution Spectrum

Cette recherche examine si les lois d'échelle des données réelles sont régies par une couverture progressive d'un spectre latent de contribution prédictive, plutôt que par la seule fréquence des jetons. En utilisant un automate de suffixes et un spectre de contribution prédictive global-KL, l'étude révèle une forte corrélation entre la pente de la queue du spectre et l'exposant d'échelle des données des apprenants GPT, montrant que le rang de troncature effectif s'échelonne logarithmiquement.

language models data scaling machine learning predictive models

RESEARCHarXiv CS.LG·07/05/2026

Structured Progressive Knowledge Activation for LLM-Driven Neural Architecture Search

Cet article présente le Structured Progressive Knowledge Activation (SPARK) pour relever le défi d'intégrer les connaissances architecturales dans la recherche d'architecture neurale (NAS) pilotée par les LLM. SPARK atténue l'"enchevêtrement fonctionnel" en permettant une édition conditionnée par facteur, ce qui conduit à des modifications d'architecture plus ciblées et fiables.

Neural Architecture Search machine learning Knowledge Integration large language models

RESEARCHDEV.to AI·il y a 4j

Remember to be Curious: Episodic Context and Persistent Worlds for 3D Exploration

Ce contenu analyse un article de recherche axé sur l'utilisation du contexte épisodique et des mondes persistants pour l'exploration 3D dans les systèmes d'IA. Il souligne un changement pertinent dans le domaine de l'intelligence artificielle, étayé par des données et des analyses.

persistent worlds episodic context AI Research 3D exploration

RESEARCHarXiv CS.LG·08/05/2026

Structural Instability of Feature Composition

Cet article présente un cadre géométrique pour analyser l'instabilité des unions de caractéristiques dans les Autoencodeurs Sparses (SAEs), notamment en ce qui concerne la direction compositionnelle. Il dérive un seuil asymptotique de collapse compositionnel sous un modèle de dictionnaire sphérique.

Feature Composition Transformer architectures Sparse autoencoders AI Research

RESEARCHarXiv CS.AI·il y a 29j

When Does a Language Model Commit? A Finite-Answer Theory of Pre-Verbalization Commitment

Cette recherche introduit une théorie de la "stabilisation de la préférence de réponse finie" pour déterminer quand la préférence de réponse d'un modèle linguistique devient stable. Elle démontre que cette stabilisation se produit souvent avant que la réponse ne soit verbalisable, avec une avance significative.

language models cognitive science machine learning NLP

RESEARCHarXiv CS.LG·il y a 29j

RateQuant: Optimal Mixed-Precision KV Cache Quantization via Rate-Distortion Theory

Cet article présente RateQuant, une méthode pour l'optimisation de la quantification du cache KV à précision mixte dans les grands modèles linguistiques afin de résoudre les goulots d'étranglement de la mémoire. Il s'attaque au problème de l'inadéquation du modèle de distorsion, où l'application du modèle de distorsion d'un quantificateur à un autre dégrade les performances par rapport à la quantification uniforme.

Memory Optimization quantization AI Research LLM