AI algorithms

6 items

RESEARCHarXiv CS.AI·vor 1T

DiBS: Diffusion-Informed Branch Selection

Der Artikel stellt DiBS vor, einen neuartigen, diffusionsmodellgesteuerten Ansatz zur Zweigauswahl beim Lösen von Sudoku, einem Problem der Nebenbedingungserfüllung. Er verbessert symbolische Löser durch die Verwendung eines Diffusionsmodells zur Steuerung der Zweiganordnung, um Vollständigkeit zu gewährleisten und Probleme bei der Langschwanzsuche zu mildern.

branch selection Diffusion Models constraint satisfaction Sudoku

RESEARCHDEV.to AI·5/1/2026

Deep Dyna-Q: Integrating Planning for Task-Completion Dialogue Policy Learning

Dieser Inhalt behandelt Deep Dyna-Q, einen Ansatz, der Planung in das Lernen von Dialogrichtlinien für aufgabenorientierte Dialogsysteme integriert. Das Ziel ist es, den Prozess der Aufgabenbewältigung durch dialogische Interaktion mit KI zu optimieren.

reinforcement learning Natural Language Processing AI algorithms dialogue systems

RESEARCHarXiv CS.CL·5/7/2026

Free Energy-Driven Reinforcement Learning with Adaptive Advantage Shaping for Unsupervised Reasoning in LLMs

FREIA ist ein neuartiger Reinforcement-Learning-Algorithmus, der LLMs für unbeaufsichtigtes Denken verbessert und die mangelnde Anpassungsfähigkeit bestehender Methoden adressiert. Er nutzt Free Energy-Driven Reward (FER), um Konsens und Exploration auszugleichen, sowie Adaptive Advantage Shaping (AAS), um Lernsignale anzupassen. FREIA übertrifft unbeaufsichtigte Baselines in verschiedenen Denkaufgaben, insbesondere im mathematischen Denken.

LLMs reinforcement learning AI algorithms Reasoning

RESEARCHarXiv CS.CL·vor 22T

Always Learning, Always Mixing: Efficient and Simple Data Mixing All The Time

Diese Forschung stellt OP-Mix vor, einen neuartigen Algorithmus zur effizienten Datenmischung über den gesamten Lebenszyklus des Sprachmodelltrainings. Er adressiert die Herausforderung der Kombination verschiedener Datenquellen für Vortraining, kontinuierliches Lernen und Anpassung und schlägt eine einheitliche Online-Entscheidungslösung vor.

language models learning data mixing machine learning

RESEARCHarXiv CS.AI·vor 8T

Structure-Induced Information for Rerooting Levin Tree Search

Dieses Papier stellt neue Rerooter-Designs für den $\sqrt{\text{LTS}}$-Algorithmus vor, die die Skalierbarkeitsbeschränkungen der expliziten Subzielgenerierung bei der subgoal-basierten Policy-Baumsuche überwinden. Diese Designs zerlegen Probleme implizit und ermöglichen eine skalierbare Zuweisung des Suchaufwands.

policy search Optimization tree search machine learning

RESEARCHDEV.to AI·4/12/2026

LightLDA: Big Topic Models on Modest Compute Clusters

LightLDA ist ein innovativer Algorithmus zum effizienten Aufbau großer Themenmodelle, selbst auf bescheidenen Computerclustern. Er optimiert Skalierbarkeit und die Verarbeitung großer Datenmengen, wodurch fortgeschrittene Themenmodellierung zugänglicher wird.

Scalability Topic Modeling distributed computing NLP