← heapsort-ai

AI Research

146 items

RESEARCHarXiv CS.CL·il y a 13j

Bridging the Stability-Expressivity Gap: Synthetic Data Scaling and Preference Alignment for Low-Resource Spoken Language Models

Cette recherche aborde l'écart Stabilité-Expressivité dans les Modèles de Langage Parlé (SLM) pour les langues à faibles ressources, causé par l'utilisation intensive de données synthétiques. Bien que les données synthétiques améliorent la précision phonétique, elles dégradent l'expressivité prosodique, un phénomène appelé Érosion Synthétique. L'article introduit des cadres d'auto-alignement pour récupérer l'expressivité.

27
RESEARCHDEV.to AI·04/05/2026

Learning to Efficiently Sample from Diffusion Probabilistic Models

Cette recherche se concentre sur le développement de méthodes plus efficaces pour l'échantillonnage à partir de modèles probabilistes de diffusion, visant à réduire le coût computationnel et le temps associés à la génération d'échantillons de haute qualité. Elle explore de nouveaux algorithmes pour accélérer le processus d'échantillonnage tout en maintenant la fidélité des données générées.

27
RESEARCHarXiv CS.CL·06/04/2026

Single-Agent LLMs Outperform Multi-Agent Systems on Multi-Hop Reasoning Under Equal Thinking Token Budgets

Este estudo argumenta, com base na Desigualdade de Processamento de Dados, que LLMs de agente único são mais eficientes em termos de informação do que sistemas multiagente sob orçamentos de token de raciocínio iguais. A pesquisa testa empiricamente esta previsão, que sugere que sistemas multiagente se tornam competitivos quando a utilização de contexto de um único agente é degradada ou mais poder computacional é despendido.

27
RESEARCHarXiv CS.LG·06/05/2026

Generate, Filter, Control, Replay: A Comprehensive Survey of Rollout Strategies for LLM Reinforcement Learning

Cette étude propose une vue agnostique de l'optimiseur des stratégies de déploiement (rollout) pour le post-entraînement des LLM de raisonnement basés sur le RL. Elle formalise les pipelines de déploiement avec une notation unifiée et introduit la taxonomie du cycle de vie Generate-Filter-Control-Replay (GFCR), décomposant les pipelines en quatre étapes modulaires.

27
RESEARCHarXiv CS.CL·07/04/2026

Evolutionary Search for Automated Design of Uncertainty Quantification Methods

Este artigo explora o uso de busca evolucionária impulsionada por LLMs para desenvolver automaticamente métodos de Quantificação de Incerteza (UQ) não supervisionados. Os métodos evoluídos superam baselines manuais em verificação de alegações, demonstrando generalização robusta e estratégias distintas entre diferentes modelos de LLM.

27
RESEARCHarXiv CS.CL·il y a 29j

jina-embeddings-v5-omni: Geometry-preserving Embeddings via Locked Aligned Towers

Ce travail présente GELATO, une nouvelle approche pour les modèles d'embedding multimodaux qui étend les architectures de type VLM. Il en résulte la suite jina-embeddings-v5-omni, qui encode efficacement texte, image, audio et vidéo dans un espace d'embedding sémantique unique en gelant les modèles de texte principaux et en entraînant uniquement les composants de connexion.

27
RESEARCHarXiv CS.AI·il y a 20j

High Quality Embeddings for Horn Logic Reasoning

Cet article présente de nouvelles approches pour créer des embeddings de haute qualité pour les énoncés logiques, essentiels pour l'entraînement des réseaux neuronaux à classer efficacement les choix des raisonneurs logiques. Ces méthodes impliquent la génération d'ancres avec des termes répétés, l'équilibrage des exemples faciles, moyens et difficiles pour l'entraînement par triplet loss, et l'accentuation périodique des exemples les plus difficiles.

27
RESEARCHarXiv CS.AI·il y a 22j

Scalable Uncertainty Reasoning in Knowledge Graphs

Cette recherche propose un cadre modulaire pour aborder le raisonnement d'incertitude évolutif dans les graphes de connaissances, où les données du monde réel contiennent souvent une incertitude inhérente. Elle traite trois niveaux d'incertitude — valeurs d'attributs imprécises, existence de triples probabilistes et connaissance de schéma incomplète — par des techniques sur mesure comme les littéraux probabilistes, les circuits probabilistes et les embeddings géométriques.

27
RESEARCHarXiv CS.AI·il y a 20j

AgentCo-op: Retrieval-Based Synthesis of Interoperable Multi-Agent Workflows

AgentCo-op est un cadre de synthèse basé sur la récupération qui compose des flux de travail multi-agents interopérables à partir de compétences, d'outils et d'agents externes. Il applique une réparation locale auto-guidée aux composants impliqués en cas d'échec d'exécution et a été démontré dans des études de cas en génomique pour coordonner des agents spécialisés.

27
ARTICLEHugging Face (YouTube)·il y a 19j

On the slow death of Scaling (birth of Adaption Labs) | Sara Hooker | HF ML Club India EP2

Ce contenu explore l'évolution des méthodologies d'IA, discutant du déclin des approches de mise à l'échelle traditionnelles et de l'émergence de nouvelles stratégies, illustrées par la naissance d'Adaption Labs. Présenté par Sara Hooker, l'épisode du HF ML Club India aborde des changements significatifs dans le domaine de l'intelligence artificielle.

On the slow death of Scaling (birth of Adaption Labs) | Sara Hooker | HF ML Club India EP2
27
ARTICLEDEV.to AI·13/04/2026

I Ran 500 More Agent Memory Experiments. The Real Problem Wasn’t Recall. It Was Binding.

Cet article décrit les résultats de 500 expériences sur la mémoire des agents d'IA, indiquant que le défi principal n'est pas le rappel mais plutôt le problème de liaison (binding). La recherche suggère qu'améliorer la manière dont les agents d'IA connectent des informations disparates est crucial pour faire progresser leurs capacités cognitives.

27