← heapsort-ai

natural language processing

167 items

RESEARCHarXiv CS.CL·il y a 1j

Improving Cross-Lingual Factual Recall via Consistency-Driven Reinforcement Learning

Cette recherche introduit PolyFact, un ensemble de données de QA factuel multilingue, pour aborder l'incohérence factuelle interlingue dans les LLMs. Elle constate que l'apprentissage par renforcement via GRPO améliore constamment le rappel factuel interlingue et la généralisation par rapport à l'ajustement fin supervisé.

60
RESEARCHarXiv CS.CL·il y a 1j

CAF-Gen: A Multi-Agent System for Enriching Argumentation Structures

CAF-Gen est un cadre multi-agents conçu pour enrichir les structures d'arguments superficielles en modèles conformes au CAF, palliant les limites des techniques actuelles de fouille d'arguments. Il utilise un pipeline itératif Créateur-Évaluateur pour assurer l'intégrité structurelle et atténuer l'instabilité.

60
RESEARCHarXiv CS.AI·il y a 19h

Automatic Extraction of Structured Information from Brain MRI Reports Using an Open-Weight Large Language Model

Cet article de recherche explore l'extraction automatique de données à partir de rapports d'IRM cérébrale à l'aide du grand modèle linguistique à poids ouvert LLaMA 3.1. Il évalue les performances du LLM dans l'analyse de rapports de neuroradiologie néerlandais, démontrant une performance zero-shot élevée.

54
RESEARCHarXiv CS.CL·il y a 19h

Bidirectional Small-Granularity Search between Code and Text

Cette recherche introduit une nouvelle tâche de recherche bidirectionnelle à petite granularité entre code et texte, visant à lier les publications scientifiques aux segments de code correspondants. Elle propose un grand ensemble de données, partiellement généré par GPT-4, et une approche modulaire qui obtient de bons résultats.

54
RESEARCHarXiv CS.CL·il y a 19h

Community-Specific Slang and Entity Detection via Semantic Shift in Fine-Tuned Language Models

Cette étude propose une méthode non supervisée pour identifier l'argot et les entités uniques des communautés en ligne en analysant l'ampleur du glissement sémantique. Le glissement sémantique est défini comme l'évolution de la représentation codée d'un mot après l'ajustement fin d'un Grand Modèle de Langage (LLM) pré-entraîné sur un corpus de texte spécifique à une communauté.

54
RESEARCHarXiv CS.CL·il y a 19h

Retrieval Augmented Generation Framework for the Nepali Legal Domain Question Answering

Cette étude présente la première application d'un modèle de Génération Augmentée par Récupération (RAG) pour la réponse aux questions juridiques en népalais, abordant la rareté des données dans les langues à faibles ressources. En utilisant BM25 sur des documents segmentés, le pipeline RAG a atteint une grande précision et véracité, démontrant son efficacité dans le domaine juridique népalais.

54
RESEARCHarXiv CS.CL·il y a 19h

Implicit Causal Graph Construction in Text via Chain Discovery

Cet article étudie la construction de graphes causaux implicites à partir de texte en inférant des événements causaux intermédiaires à l'aide de grands modèles linguistiques (LLM). Il compare la construction de graphes de bout en bout avec les méthodes de découverte de chaînes causales et évalue la validité des relations inférées par rapport à une base de données.

54
ARTICLEDEV.to AI·23/04/2026

How I built an AI RAG system to convert PDF to Q&As

Cet article détaille les cinq étapes d'ingénierie pour construire un système AI RAG nommé LongTermMemory, qui convertit des PDFs en questions-réponses. Il couvre le pipeline complet de traitement de documents, de l'extraction de texte et du découpage sémantique à l'utilisation d'une base de données vectorielle et de la Génération Augmentée par Récupération (RAG), avec un backend Laravel et FastAPI.

49
ARTICLE↑ trendingReddit r/MachineLearning·18/04/2026

easyaligner: Forced alignment with GPU acceleration and flexible text normalization (compatible with all w2v2 models on HF Hub) [P]

easyaligner est une nouvelle bibliothèque d'alignement forcé, performante et facile à utiliser, offrant une accélération GPU et une normalisation de texte flexible. Compatible avec tous les modèles w2v2 de Hugging Face Hub, elle résout les défis courants du prétraitement parole-texte, tels que les transcriptions partielles et les longs segments audio.

easyaligner: Forced alignment with GPU acceleration and flexible text normalization (compatible with all w2v2 models on HF Hub) [P]
46
RESEARCH↑ trendingReddit r/MachineLearning·24/04/2026

New project about llm hallucination [P]

Ce contenu présente un nouveau projet annexe et son dépôt GitHub, axé sur l'atténuation des hallucinations des LLM via une méthode innovante d'échantillonnage contrastif et d'entraînement sélectif. L'idée principale considère l'hallucination comme un problème de préférence, utilisant des échantillons négatifs auto-générés et un apprentissage basé sur la divergence et les portes pour promouvoir les bonnes réponses et supprimer les mauvaises.

New project about llm hallucination [P]
45
RESEARCH↑ trendingReddit r/LocalLLaMA·10/04/2026

National University of Singapore Presents "DMax": A New Paradigm For Diffusion Language Models (dLLMs) Enabling Aggressive Parallel Decoding.

DMax é um novo paradigma para modelos de linguagem de difusão (dLLMs) eficientes que mitiga o acúmulo de erros na decodificação paralela. Ele permite um paralelismo agressivo ao reformular a decodificação como um processo de auto-refinamento progressivo e introduzir uma estratégia de treinamento unificada.

44
ARTICLE↑ trendingReddit r/MachineLearning·22/04/2026

I can't believe text normalization is so underdiscussed in streaming text-to-speech [D]

L'auteur met en lumière le manque de discussion sur la normalisation de texte dans les modèles de synthèse vocale en streaming, où des erreurs surviennent lors de la prononciation de dates, d'URL et d'autres éléments. Il mentionne un benchmark comparant des modèles TTS commerciaux sur ces défis spécifiques.

42
ARTICLE↑ trendingReddit r/LocalLLaMA·il y a 19j

Qwen3.6 35Ba3 has changed my workflows and even how I use my computer

L'auteur explique comment le modèle d'IA Qwen3.6 35Ba3 a profondément remodelé ses flux de travail de développement et son utilisation de l'ordinateur, lui permettant d'automatiser des tâches complexes et d'interagir avec le système d'exploitation en langage naturel. Cette transformation lui permet de déléguer des tâches comme le devops, la création de contenu et les tests de code à l'IA, soulignant un changement significatif de productivité.

42
RESEARCHarXiv CS.CL·il y a 1j

HKJudge: A Legal Discourse-Annotated Corpus for Interpreting What Courts Find, How They Reason, and What They Rule

Le projet HKJudge présente le premier corpus de discours juridique annoté par des experts au niveau des phrases, concernant les jugements criminels de Hong Kong, comprenant environ 290 000 phrases. Il utilise un schéma de discours à deux niveaux pour identifier ce que les tribunaux constatent, comment ils raisonnent et ce qu'ils statuent, avec un accord inter-annotateurs élevé.

40
RESEARCHarXiv CS.CL·21/04/2026

Foundational Study on Authorship Attribution of Japanese Web Reviews for Actor Analysis

Cette étude fondamentale explore l'attribution de paternité basée sur des caractéristiques stylistiques pour l'analyse d'acteurs en renseignement sur les menaces, en testant des méthodes sur des revues web japonaises. Alors que le fine-tuning de BERT a obtenu les meilleures performances, TF-IDF avec régression logistique a montré une stabilité et une précision supérieures face à des centaines d'auteurs.

36