← heapsort-ai

LLMs

714 items

ARTICLEDEV.to AI·vor 1T

Top AI App Development Trends Every Business Should Watch in 2026

Künstliche Intelligenz ist zur Grundlage moderner digitaler Innovation geworden, wobei Unternehmen im Jahr 2026 KI-gestützte Anwendungen nutzen, um Abläufe zu automatisieren und Kundenerlebnisse zu personalisieren. Die rasche Weiterentwicklung von Generativer KI, LLMs und multimodaler KI verändert die App-Entwicklung, weshalb es für Unternehmen unerlässlich ist, diese Trends zu verstehen, um wettbewerbsfähig zu bleiben.

62
ARTICLEDEV.to AI·4/15/2026

Technical Guide to GEO Optimization

Dieser Leitfaden beleuchtet eine grundlegende Verschiebung im Nutzerverhalten hin zur Konsultation von KI-Modellen für komplexe Probleme, wodurch traditionelles SEO unzureichend wird. Er stellt Generative Engine Optimization (GEO) vor, ein neues von TeviroAI entwickeltes Framework, das Inhalte für die Aufnahme durch KI-Modelle optimiert, indem es Entitätsbeziehungen statt Keywords abbildet.

61
RESEARCHarXiv CS.AI·vor 1T

SafeGene: Reusable Adapters for Transferable Safety Alignment

SafeGene führt ein wiederverwendbares Sicherheitsadapter-Modul ein, das entwickelt wurde, um die wiederkehrende Herausforderung der Aufrechterhaltung der Sicherheitsausrichtung in feinabgestimmten Open-Weight-LLMs zu bewältigen. Es entkoppelt Sicherheitsfähigkeiten von aufgabenspezifischen Aktualisierungen und behandelt sie als eine unabhängige und übertragbare Adapterrepräsentation, um die Anfälligkeit für bösartige Prompts zu mindern.

60
RESEARCHarXiv CS.AI·vor 1T

Lean4Agent: Formal Modeling and Verification for Agent Workflow and Trajectory

Das Papier stellt Lean4Agent vor, ein Framework, das Lean4 zur formalen Modellierung und Verifizierung des Agentenverhaltens, insbesondere bei LLM-gesteuerten Mehrschritt-Workflows, einsetzt. Es adressiert den Mangel an formalen Methoden in aktuellen Agentensystemen, indem es semantische Konsistenzprüfungen und die Lokalisierung von Laufzeitfehlern ermöglicht.

60
RESEARCHarXiv CS.CL·vor 1T

Improving Cross-Lingual Factual Recall via Consistency-Driven Reinforcement Learning

Diese Forschung stellt PolyFact vor, einen mehrsprachigen faktischen QA-Datensatz, um die sprachübergreifende faktische Inkonsistenz in LLMs zu beheben. Es wird festgestellt, dass Reinforcement Learning mittels GRPO die sprachübergreifende faktenbasierte Wiedergabe und Generalisierung im Vergleich zu supervised Fine-Tuning konsistent verbessert.

60
RESEARCHarXiv CS.CL·vor 1T

What Do People Actually Want From AI? Mapping Preference Plurality

Diese Studie untersucht, was Menschen tatsächlich von KI-Systemen erwarten, indem sie 1.500 offene Antworten aus 75 Ländern analysiert. Sie zeigt, dass aktuelle LLM-Feinabstimmungsmethoden wie RLHF Einschränkungen bei der Aggregation unterschiedlicher und oft widersprüchlicher Präferenzen aufweisen, was die Pluralität von Werten und Interpretationen verdeutlicht.

60
RESEARCHarXiv CS.LG·vor 1T

Skip a Layer or Loop It? Learning Program-of-Layers in LLMs

Diese Forschung stellt "Program-of-Layers (PoLar)" für LLMs vor, das dynamisches Überspringen oder Wiederholen von vortrainierten Schichten während der Inferenz ermöglicht, um gleiche oder bessere Genauigkeit bei kürzeren Ausführungspfaden zu erzielen. Ein leichtgewichtiges Vorhersagenetzwerk lernt, diese maßgeschneiderten Programme zu generieren und zeigt verbesserte Leistung bei mathematischen Reasoning-Benchmarks.

60
ARTICLEDEV.to AI·vor 14Std

Artificial Intelligence in 2026: How AI Is Reshaping Software Development

Künstliche Intelligenz hat sich schnell zu einer Kerntechnologie entwickelt, die die moderne Softwareentwicklung neu gestaltet und die Codegenerierung, Automatisierung und verschiedene Branchen beeinflusst. Bis 2026 gilt KI als grundlegende Technologie für Unternehmen und Entwickler, mit zunehmender Erforschung von LLMs, KI-Agenten und Machine-Learning-Frameworks.

58
ARTICLEDEV.to AI·4/17/2026

How I Use OpenCode, Oh-My-OpenCode-Slim, and OpenSpec to Build My Own AI Coding Environment

Der Autor teilt seine Erfahrungen beim Aufbau einer benutzerdefinierten KI-Programmierumgebung mit Open-Source-Tools wie OpenCode, Oh-My-OpenCode-Slim und OpenSpec als Alternative zu teuren proprietären Lösungen. Sie argumentieren, dass führende Open-Source-Modelle bei richtiger Nutzung mit guten Tools und Spezifikationen tägliche Programmieraufgaben effektiv bewältigen können, wobei der Fokus auf Community-Beiträgen liegt.

56
RESEARCHarXiv CS.CL·vor 19Std

Post-training is (Massive) Supervised Learning

Dieses Papier argumentiert, dass das vorherrschende Post-Trainings-Paradigma für LLMs, das SFT und RL umfasst, effektiv zu dem Ansatz "vorab trainieren und dann feinabstimmen" zurückkehrt, indem Modelle explizit auf gewünschte Verhaltensweisen und spezifische Benchmarks zugeschnitten werden. Empirische Beweise zeigen, dass von Grund auf neu post-trainierte Modelle eine nicht-triviale Leistung auf Reasoning-Datensätzen erzielen können.

55
RESEARCHarXiv CS.AI·vor 19Std

OmniMem: Perturbation-aware Memory Compression for Streaming Audio-Visual LLMs

OmniMem ist ein speichereffizientes Streaming-Framework für audiovisuelle LLMs, das entwickelt wurde, um die Einschränkungen der Langvideo-Inferenz aufgrund zunehmender Videotoken und KV-Caches zu überwinden. Es verwendet eine modalitätsbewusste Speicherzuweisung und eine störungsbewusste Speicherauswahl, um informative KV-Zustände zu erhalten, wodurch Komprimierung und Weitbereichsverständnis verbessert werden.

54
RESEARCHarXiv CS.CL·vor 19Std

TinyJudge: Unverifiable Constraint Alignment via Lightweight Specialist Ensembles

Der Artikel stellt TinyJudge vor, ein Framework, das ein Ensemble spezialisierter kleiner Sprachmodelle (0.6B) verwendet, um leichte und hochpräzise Belohnungen für weiche, nicht überprüfbare Einschränkungen bei der Befolgung von Anweisungen durch LLMs zu liefern. Dieser Ansatz behebt Engpässe wie Reward Hacking und hohen Rechenaufwand bei herkömmlichen LLM-as-a-Judge-Methoden zur Einschränkungsanpassung.

54
RESEARCHarXiv CS.CL·vor 19Std

ABLE: Representing and Mapping LLMs via Attribution-Based Large-model Embedding

ABLE (Attribution-Based Large-model Embedding) stellt ein Framework zur Darstellung großer Sprachmodelle vor, das den Interpretierbarkeitsraum nutzt. Es adressiert Herausforderungen beim systematischen Modellvergleich, indem es gradientenbasierte Feature-Attributionen aggregiert, um modellspezifische Eingabe-Empfindlichkeitsmuster zu erfassen.

54
ARTICLEDEV.to AI·vor 1T

Keeping a chat app's token bill flat as conversations grow

Dieser Artikel behandelt das Problem steigender Token-Kosten in KI-Chat-Anwendungen, wenn Gespräche länger werden, da der gesamte Gesprächsverlauf bei jeder Runde erneut gesendet wird. Es wird eine Lösung vorgestellt, die eine "rollierende Zusammenfassung" mit einem "wörtlichen Fenster" kombiniert, um die Token-Nutzung zu optimieren und die Kosten zu kontrollieren.

52
ARTICLEDEV.to AI·vor 2T

The Five Faculties: A Tour of SAFi's Cognitive Architecture

Der Inhalt stellt SAFi (Self-Alignment Framework Interface) vor, eine KI-Governance-Architektur, die von der üblichen prompt-basierten Ausrichtung abweicht, indem sie die Kognition auf fünf spezialisierte Fakultäten aufteilt. Dieses System zielt darauf ab, die Generierung, Evaluierung und Ausführung von KI zu entkoppeln, beginnend mit einer vorgenerierenden Sicherheitsbarriere, um Prompt-Injektionen und andere Bedrohungen zu verhindern.

49