← heapsort-ai

AI Research

146 items

RESEARCHarXiv CS.LG·4/22/2026

Compile to Compress: Boosting Formal Theorem Provers by Compiler Outputs

Diese Forschung stellt ein neuartiges Lern-zu-Verfeinern-Framework vor, um die prohibitiv hohen Rechenkosten von großen Sprachmodellen (LLMs) beim formalen Theorembeweisen zu adressieren. Durch die Nutzung von Compiler-Ausgaben, die diverse Beweisversuche in strukturierte Fehlermodi komprimieren, ermöglicht die Methode eine effiziente Beweiserkundung und lokale Fehlerkorrektur, wodurch die Denkfähigkeiten der Basisprufer erheblich verstärkt werden.

27
RESEARCHarXiv CS.AI·5/6/2026

Programmatic Context Augmentation for LLM-based Symbolic Regression

Dieses Papier stellt ein neuartiges LLM-basiertes evolutionäres Suchframework für die symbolische Regression vor, das die Einschränkungen bestehender Methoden, die sich ausschließlich auf skalare Bewertungsmetriken verlassen, überwindet. Es integriert die programmatische Kontextaugmentation, um codebasierte Datenanalyse und eine reichere Informationsgewinnung zu ermöglichen, mit dem Ziel, die Entdeckung mathematischer Ausdrücke zu verbessern.

27
RESEARCHarXiv CS.LG·vor 27T

Hierarchical Multi-Scale Graph Neural Networks: Scalable Heterophilous Learning with Oversmoothing and Oversquashing Mitigation

Das Papier stellt Hierarchical Multi-view HAAR (HMH) vor, ein neuartiges spektrales Graphen-Lernframework, das Oversmoothing und grad-verzerrte Aggregation in heterophilen GNNs angeht. HMH konstruiert eine weiche Graphen-Hierarchie und wendet lernbare spektrale Filter mit Haar-Basen an, was eine nahezu lineare Skalierbarkeit ermöglicht.

27
RESEARCHarXiv CS.CL·vor 21T

SKG-Eval: Stateful Evaluation of Multi-Turn Dialogue via Incremental Semantic Knowledge Graphs

SKG-Eval befasst sich mit der Herausforderung der Evaluierung von Multi-Turn-Dialogsystemen, indem es den Dialog als einen sich entwickelnden Semantischen Wissensgraphen (SKG) modelliert. Dieses Framework aktualisiert den Graphen inkrementell durch strukturierte Tripel-Extraktion, um weitreichende Probleme wie Widersprüche und Inkonsistenzen zu erkennen, und bietet eine verbesserte Evaluierung jenseits von turn-isolierten Repräsentationen.

27
RESEARCHDEV.to AI·vor 15T

François Chollet 谈 AGI 未来

François Chollet erörtert die Zukunft der AGI, deren Ankunft er um 2030 prognostiziert, und stellt die Mission des NDI-Labors vor, ein neues, "optimales" maschinelles Lernparadigma basierend auf symbolischer Programmsynthese zu entwickeln. Er kritisiert die Grenzen des Deep Learning und skizziert die risikoreiche, aber potenziell hoch lohnende Strategie von NDI für grundlegende KI-Fortschritte.

27
ARTICLEDEV.to AI·vor 9T

Start Here: My AI Memory Research So Far

Der Autor beschreibt seine Forschungsreise im Bereich des KI-Speichers und detailliert vier Entdeckungsphasen über die Funktionsweise und Herausforderungen dieser Systeme. Er untersucht das Überleben des Speichers nach Resets, die Bedeutung des Korrekturspeichers, die Beziehung zwischen Abrufgenauigkeit und Sicherheit sowie den entscheidenden Unterschied zwischen Relevanz und Autorität im KI-Speicher.

27
ARTICLEDEV.to AI·vor 24T

Understanding AI-Moderated Interviews: Where AI Meets Human Insight

KI-moderierte Interviews revolutionieren die Marktforschung und ermöglichen es Unternehmen, reichhaltige, nuancierte Antworten von einer großen Anzahl von Personen gleichzeitig zu erhalten. Diese Technologie kombiniert künstliche Intelligenz mit Konversationsforschung, um die Lücke zwischen Skalierung und Tiefe beim Verständnis menschlichen Verhaltens zu schließen.

27
RESEARCHDEV.to AI·vor 26T

Uncertainty Estimates of Predictions via a General Bias-Variance Decomposition

Eine neue allgemeine Bias-Varianz-Zerlegung für strikt geeignete Bewertungsregeln wurde endlich in einem AISTATS 2023-Papier von Gruber & Buettner vorgestellt. Dieser Fortschritt bietet praktische Werkzeuge zum Verständnis von Ensemble-Modellen, zur Konstruktion von Konfidenzbereichen und zur Verbesserung der Erkennung von Out-of-Distribution-Eingaben, wodurch eine langjährige Lücke in der Unsicherheitsschätzung geschlossen wird.

27
RESEARCHarXiv CS.CL·5/5/2026

H-Probes: Extracting Hierarchical Structures From Latent Representations of Language Models

Diese Arbeit stellt H-Probes vor, lineare Sonden zur Extraktion hierarchischer Strukturen, insbesondere Tiefe und paarweiser Abstand, aus latenten Repräsentationen großer Sprachmodelle. Die Forschung zeigt, dass diese Sonden robust niederdimensionale Unterräume finden, die für die Leistung bei synthetischen Baumdurchlaufaufgaben entscheidend sind und gut innerhalb sowie außerhalb des Bereichs generalisieren.

27
RESEARCHarXiv CS.CL·5/1/2026

Semantic Structure of Feature Space in Large Language Models

Diese Studie zeigt, dass die geometrischen Beziehungen zwischen semantischen Merkmalen in den verborgenen Zuständen großer Sprachmodelle menschliche psychologische Assoziationen widerspiegeln. Es wird demonstriert, dass Wortvektorprojektionen auf semantische Achsen mit menschlichen Bewertungen korrelieren und die Ähnlichkeit zwischen diesen Achsen die Zusammenhänge von semantischen Skalen vorhersagt.

27