← heapsort-ai

NLP

124 items

RESEARCHarXiv CS.AI·vor 11T

Frontier LLM-based agents can overcome the ontology curation bottleneck for natural phenotypes

Fortschrittliche LLM-basierte Agenten können den Engpass bei der Ontologiekuration für natürliche Phänotypen überwinden, einen arbeitsintensiven Prozess, der von menschlichen Experten abhängt. Dies könnte die Skalierbarkeit der Annotation von Freitext-Phänotypbeschreibungen zu Ontologiebegriffen erheblich verbessern, was für die Integration vergleichender morphologischer Daten unerlässlich ist.

27
RESEARCHarXiv CS.CL·vor 13T

In-Context Optimization for Retrieval-Augmented Generation: A Gradient-Descent Perspective

Diese Forschungsarbeit untersucht Retrieval-Augmented Generation (RAG) aus der Perspektive der In-Context-Optimierung. Sie zeigt, dass eine einzelne lineare Selbstaufmerksamkeitsschicht einen Gradientenabstiegschritt auf einem vereinheitlichten linearisierten RAG-Ziel implementieren kann, was ein exaktes Regime offenbart, in dem abrufgestützte Vorhersage und In-Context-Optimierung zusammenfallen.

27
ARTICLEDEV.to AI·4/20/2026

Chatbot ไทยประมวลผลภาษาไร้เว้นวรรคได้อย่างไร

Dieser Artikel erklärt, warum thailändische Chatbots aufgrund des Fehlens klarer Worttrennung im Thai oft scheitern und wie man intelligentere Bots entwickelt. Er beschreibt die Prinzipien und Schritte für eine effektive Verarbeitung der thailändischen Sprache und hebt Lösungen wie Rasas DIET-Architektur und PyThaiNLPs newmm-Tokenisierung hervor.

27
ARTICLEDEV.to AI·vor 11T

The Real Work in Graph RAG Is Not Extraction

Die eigentliche Herausforderung bei Graph RAG ist nicht die Datenextraktion, sondern die Normalisierung, um die Navigierbarkeit des Graphen zu gewährleisten. Der Autor entdeckte dies beim Aufbau eines Wissensgraphen für 2asy.ai, bei dem inkonsistente Benennungen von Entitäten und Beziehungstypen den Graphen trotz erfolgreicher Extraktion unbrauchbar machten.

27
ARTICLEDEV.to AI·5/10/2026

How AI-pilled are you?

Das Produkt "How AI-pilled are you?" ist eine webbasierte Anwendung, die NLP und ML nutzt, um das KI-Wissen einer Person zu bewerten. Diese technische Analyse beschreibt die Architektur der Anwendung, die ein Frontend für die Benutzerinteraktion und ein Backend für die Datenverarbeitung und NLP-Aufgaben umfasst.

27
RESEARCHarXiv CS.CL·4/30/2026

Evaluation Revisited: A Taxonomy of Evaluation Concerns in Natural Language Processing

Angesichts der jüngsten Fortschritte bei LLMs führt dieses Papier eine umfassende Überprüfung der langen Geschichte methodologischer Reflexionen in der NLP über Bewertungsbelange durch. Es entwickelt eine Taxonomie, die wiederkehrende Positionen und Kompromisse synthetisiert, und bietet eine strukturierte Checkliste zur Unterstützung einer bewussteren Bewertungsgestaltung und -interpretation.

27
RESEARCHarXiv CS.LG·5/6/2026

On the Invariants of Softmax Attention

Diese Forschung definiert das "Energiefeld" in der Softmax-Aufmerksamkeit und deckt wesentliche invariante Eigenschaften auf. Sie unterscheidet zwischen mechanismusbezogenen Invarianten, die aus der algebraischen Struktur abgeleitet sind, und modellbezogenen Regularitäten, die in autoregressiven Sprachmodellen beobachtet werden.

27
RESEARCHarXiv CS.CL·4/8/2026

The Illusion of Latent Generalization: Bi-directionality and the Reversal Curse

Este artigo aborda a 'maldição da reversão' em modelos de linguagem autorregressivos, onde falham ao recuperar fatos em ordem inversa. A pesquisa demonstra que a precisão da reversão exige um sinal de treinamento que torne a entidade de origem um alvo de previsão, indicando armazenamento separado para direções diretas e inversas, em vez de uma representação única e agnóstica à direção.

27
RESEARCHarXiv CS.CL·4/6/2026

An Empirical Study of Many-Shot In-Context Learning for Machine Translation of Low-Resource Languages

Este estudo empírico investiga o aprendizado em contexto (ICL) de muitos exemplos para tradução automática de inglês para dez idiomas de baixo recurso. Os achados mostram que o ICL se torna mais eficaz com o aumento do número de exemplos, e a recuperação baseada em BM25 melhora substancialmente a eficiência dos dados.

27
RESEARCHarXiv CS.CL·5/6/2026

Semantically Enriching Investor Micro-blogs for Opinion-Aware Emotion Analysis: A Practical Approach

Diese Forschung schlägt vor, Investoren-Micro-Blogs semantisch anzureichern, um die meinungsbewusste Emotionsanalyse zu verbessern. Sie erweitert den StockEmotions-Datensatz mit granularen Meinungsdiagrammen mithilfe einer LLM-Pipeline und zeigt eine verbesserte Klassifikationsleistung mit Graph Neural Networks.

27
RESEARCHarXiv CS.CL·5/6/2026

Effective Performance Measurement: Challenges and Opportunities in KPI Extraction from Earnings Calls

Diese Forschungsarbeit untersucht die Herausforderungen bei der Extraktion von KPIs aus unstrukturierten Gewinnmitteilungen im Gegensatz zu den standardisierten SEC-Einreichungen. Sie führt drei neue Benchmarks (SECB, ECB und ECB-A) zur Bewertung von Modellen ein und stellt fest, dass Encoder-basierte Modelle mit dem Domänenwechsel Schwierigkeiten haben.

27