← heapsort-ai

NLP

124 items

RESEARCHarXiv CS.AI·il y a 11j

Frontier LLM-based agents can overcome the ontology curation bottleneck for natural phenotypes

Les agents basés sur des LLM de pointe peuvent surmonter le goulot d'étranglement de la curation d'ontologies pour les phénotypes naturels, un processus laborieux dépendant d'experts humains. Cela permettra d'améliorer considérablement la mise à l'échelle de l'annotation des descriptions de phénotypes en texte libre vers les termes d'ontologie, essentielle pour l'intégration des données morphologiques comparatives.

27
RESEARCHarXiv CS.CL·il y a 13j

In-Context Optimization for Retrieval-Augmented Generation: A Gradient-Descent Perspective

Cet article de recherche explore la Génération Augmentée par Récupération (RAG) sous l'angle de l'optimisation en contexte. Il démontre qu'une seule couche d'auto-attention linéaire peut exécuter une étape de descente de gradient sur un objectif RAG linéarisé unifié, révélant un régime exact où la prédiction augmentée par récupération et l'optimisation en contexte coïncident.

27
ARTICLEDEV.to AI·20/04/2026

Chatbot ไทยประมวลผลภาษาไร้เว้นวรรคได้อย่างไร

Cet article explique pourquoi les chatbots thaïlandais échouent souvent en raison de l'absence de séparation claire des mots dans la langue et comment en construire de plus intelligents. Il aborde les principes et les étapes d'un traitement efficace de la langue thaïlandaise, mettant en avant des solutions comme l'architecture DIET de Rasa et le tokeniseur newmm de PyThaiNLP.

27
ARTICLEDEV.to AI·il y a 11j

The Real Work in Graph RAG Is Not Extraction

La véritable difficulté du Graph RAG n'est pas l'extraction de données, mais la normalisation pour assurer la navigabilité du graphe. L'auteur l'a découvert en construisant un graphe de connaissances pour 2asy.ai, où l'incohérence dans la dénomination des entités et des types de relations rendait le graphe inutilisable malgré une extraction réussie.

27
ARTICLEDEV.to AI·10/05/2026

How AI-pilled are you?

Le produit "How AI-pilled are you?" est une application web qui utilise le PNL et le ML pour évaluer les connaissances d'un individu en matière d'IA. Cette analyse technique détaille l'architecture de l'application, comprenant un front-end pour l'interaction utilisateur et un back-end pour le traitement des données et les tâches de PNL.

27
RESEARCHarXiv CS.CL·30/04/2026

Evaluation Revisited: A Taxonomy of Evaluation Concerns in Natural Language Processing

Motivé par les récentes avancées des LLM, cet article réalise une revue de la littérature sur l'historique des réflexions méthodologiques en PNL concernant les pratiques d'évaluation. Il développe une taxonomie synthétisant les positions récurrentes et les compromis, et propose une liste de contrôle structurée pour une conception et une interprétation plus délibérées de l'évaluation.

27
RESEARCHarXiv CS.LG·06/05/2026

On the Invariants of Softmax Attention

Cette recherche définit le "champ d'énergie" dans l'attention softmax, révélant des propriétés invariantes essentielles. Elle distingue les invariants au niveau du mécanisme, dérivés de la structure algébrique, des régularités au niveau du modèle observées dans les modèles de langage autorégressifs.

27
RESEARCHarXiv CS.CL·08/04/2026

The Illusion of Latent Generalization: Bi-directionality and the Reversal Curse

Este artigo aborda a 'maldição da reversão' em modelos de linguagem autorregressivos, onde falham ao recuperar fatos em ordem inversa. A pesquisa demonstra que a precisão da reversão exige um sinal de treinamento que torne a entidade de origem um alvo de previsão, indicando armazenamento separado para direções diretas e inversas, em vez de uma representação única e agnóstica à direção.

27
RESEARCHarXiv CS.CL·06/04/2026

An Empirical Study of Many-Shot In-Context Learning for Machine Translation of Low-Resource Languages

Este estudo empírico investiga o aprendizado em contexto (ICL) de muitos exemplos para tradução automática de inglês para dez idiomas de baixo recurso. Os achados mostram que o ICL se torna mais eficaz com o aumento do número de exemplos, e a recuperação baseada em BM25 melhora substancialmente a eficiência dos dados.

27
RESEARCHarXiv CS.CL·06/05/2026

Semantically Enriching Investor Micro-blogs for Opinion-Aware Emotion Analysis: A Practical Approach

Cette recherche propose d'enrichir sémantiquement les micro-blogs d'investisseurs pour améliorer l'analyse des émotions basée sur l'opinion. Elle augmente l'ensemble de données StockEmotions avec des graphes d'opinion granulaires via un pipeline LLM et démontre une performance de classification améliorée avec les Réseaux de Neurones Graphiques.

27
RESEARCHarXiv CS.CL·06/05/2026

Effective Performance Measurement: Challenges and Opportunities in KPI Extraction from Earnings Calls

Cet article de recherche explore les défis liés à l'extraction des indicateurs de performance clés (KPI) à partir des appels de résultats non structurés, contrastant avec les dépôts normalisés de la SEC. Il introduit trois nouveaux benchmarks (SECB, ECB et ECB-A) pour évaluer les modèles, constatant que les modèles basés sur des encodeurs rencontrent des difficultés avec le changement de domaine.

27