LLMs

714 items

ARTICLEDEV.to AI·vor 1T

Top AI App Development Trends Every Business Should Watch in 2026

Künstliche Intelligenz ist zur Grundlage moderner digitaler Innovation geworden, wobei Unternehmen im Jahr 2026 KI-gestützte Anwendungen nutzen, um Abläufe zu automatisieren und Kundenerlebnisse zu personalisieren. Die rasche Weiterentwicklung von Generativer KI, LLMs und multimodaler KI verändert die App-Entwicklung, weshalb es für Unternehmen unerlässlich ist, diese Trends zu verstehen, um wettbewerbsfähig zu bleiben.

AI applications LLMs AI trends AI development

ARTICLEDEV.to AI·4/15/2026

Technical Guide to GEO Optimization

Dieser Leitfaden beleuchtet eine grundlegende Verschiebung im Nutzerverhalten hin zur Konsultation von KI-Modellen für komplexe Probleme, wodurch traditionelles SEO unzureichend wird. Er stellt Generative Engine Optimization (GEO) vor, ein neues von TeviroAI entwickeltes Framework, das Inhalte für die Aufnahme durch KI-Modelle optimiert, indem es Entitätsbeziehungen statt Keywords abbildet.

LLMs GEO AI Generative Engine Optimization

RESEARCHarXiv CS.AI·vor 1T

SafeGene: Reusable Adapters for Transferable Safety Alignment

SafeGene führt ein wiederverwendbares Sicherheitsadapter-Modul ein, das entwickelt wurde, um die wiederkehrende Herausforderung der Aufrechterhaltung der Sicherheitsausrichtung in feinabgestimmten Open-Weight-LLMs zu bewältigen. Es entkoppelt Sicherheitsfähigkeiten von aufgabenspezifischen Aktualisierungen und behandelt sie als eine unabhängige und übertragbare Adapterrepräsentation, um die Anfälligkeit für bösartige Prompts zu mindern.

LLMs security

RESEARCHarXiv CS.AI·vor 1T

Lean4Agent: Formal Modeling and Verification for Agent Workflow and Trajectory

Das Papier stellt Lean4Agent vor, ein Framework, das Lean4 zur formalen Modellierung und Verifizierung des Agentenverhaltens, insbesondere bei LLM-gesteuerten Mehrschritt-Workflows, einsetzt. Es adressiert den Mangel an formalen Methoden in aktuellen Agentensystemen, indem es semantische Konsistenzprüfungen und die Lokalisierung von Laufzeitfehlern ermöglicht.

Lean4 LLMs workflow automation Formal verification

RESEARCHarXiv CS.CL·vor 1T

Improving Cross-Lingual Factual Recall via Consistency-Driven Reinforcement Learning

Diese Forschung stellt PolyFact vor, einen mehrsprachigen faktischen QA-Datensatz, um die sprachübergreifende faktische Inkonsistenz in LLMs zu beheben. Es wird festgestellt, dass Reinforcement Learning mittels GRPO die sprachübergreifende faktenbasierte Wiedergabe und Generalisierung im Vergleich zu supervised Fine-Tuning konsistent verbessert.

Multilingual AI LLMs reinforcement learning machine learning

RESEARCHarXiv CS.CL·vor 1T

UnpredictaBench: A Benchmark for Evaluating Distributional Randomness in LLMs

UnpredictaBench wird als neuer Benchmark eingeführt, um die Fähigkeit großer Sprachmodelle (LLMs) zu bewerten, wahre zugrunde liegende Verteilungen zu erfassen, da sie oft zu einer einzigen plausiblen Antwort tendieren. Er umfasst 448 Probleme und eine KS@N-Metrik, um Stichproben aus verschiedenen Zieldistributionen zu testen.

AI models LLMs evaluation Benchmarking

RESEARCHarXiv CS.CL·vor 1T

What Do People Actually Want From AI? Mapping Preference Plurality

Diese Studie untersucht, was Menschen tatsächlich von KI-Systemen erwarten, indem sie 1.500 offene Antworten aus 75 Ländern analysiert. Sie zeigt, dass aktuelle LLM-Feinabstimmungsmethoden wie RLHF Einschränkungen bei der Aggregation unterschiedlicher und oft widersprüchlicher Präferenzen aufweisen, was die Pluralität von Werten und Interpretationen verdeutlicht.

LLMs Human Alignment RLHF User studies

RESEARCHarXiv CS.LG·vor 1T

Skip a Layer or Loop It? Learning Program-of-Layers in LLMs

Diese Forschung stellt "Program-of-Layers (PoLar)" für LLMs vor, das dynamisches Überspringen oder Wiederholen von vortrainierten Schichten während der Inferenz ermöglicht, um gleiche oder bessere Genauigkeit bei kürzeren Ausführungspfaden zu erzielen. Ein leichtgewichtiges Vorhersagenetzwerk lernt, diese maßgeschneiderten Programme zu generieren und zeigt verbesserte Leistung bei mathematischen Reasoning-Benchmarks.

neural networks mathematical reasoning inference LLMs

ARTICLEDEV.to AI·4/23/2026

Serving Infrastructure — Deep Dive + Problem: Softmax Function

Die Serving-Infrastruktur ist entscheidend für die Bereitstellung und Verwaltung großer Sprachmodelle (LLMs) in Produktionsumgebungen, um eine effiziente und zuverlässige Bereitstellung von Modellvorhersagen zu gewährleisten. Sie überbrückt die Lücke zwischen Modellentwicklung und realer Anwendung und beeinflusst direkt Leistung, Skalierbarkeit und Wartbarkeit.

Scalability Optimization LLMs deployment

ARTICLEDEV.to AI·vor 14Std

Vector Databases in AI Projects: Are They Really Necessary?

Dieser Artikel hinterfragt die absolute Notwendigkeit von Vektordatenbanken in KI-Projekten, insbesondere bei der Verwendung von LLMs und RAG. Ziel ist es, deren Vor- und Nachteile sowie Alternativen zu beleuchten und Einblicke für bessere Architektur Entscheidungen zu geben.

AI architecture LLMs Vector Databases RAG

ARTICLEDEV.to AI·vor 14Std

Artificial Intelligence in 2026: How AI Is Reshaping Software Development

Künstliche Intelligenz hat sich schnell zu einer Kerntechnologie entwickelt, die die moderne Softwareentwicklung neu gestaltet und die Codegenerierung, Automatisierung und verschiedene Branchen beeinflusst. Bis 2026 gilt KI als grundlegende Technologie für Unternehmen und Entwickler, mit zunehmender Erforschung von LLMs, KI-Agenten und Machine-Learning-Frameworks.

LLMs Software Development machine learning artificial intelligence

ARTICLEDEV.to AI·4/17/2026

How I Use OpenCode, Oh-My-OpenCode-Slim, and OpenSpec to Build My Own AI Coding Environment

Der Autor teilt seine Erfahrungen beim Aufbau einer benutzerdefinierten KI-Programmierumgebung mit Open-Source-Tools wie OpenCode, Oh-My-OpenCode-Slim und OpenSpec als Alternative zu teuren proprietären Lösungen. Sie argumentieren, dass führende Open-Source-Modelle bei richtiger Nutzung mit guten Tools und Spezifikationen tägliche Programmieraufgaben effektiv bewältigen können, wobei der Fokus auf Community-Beiträgen liegt.

LLMs open-source AI coding environment multi-agent systems

RESEARCHarXiv CS.CL·vor 19Std

Post-training is (Massive) Supervised Learning

Dieses Papier argumentiert, dass das vorherrschende Post-Trainings-Paradigma für LLMs, das SFT und RL umfasst, effektiv zu dem Ansatz "vorab trainieren und dann feinabstimmen" zurückkehrt, indem Modelle explizit auf gewünschte Verhaltensweisen und spezifische Benchmarks zugeschnitten werden. Empirische Beweise zeigen, dass von Grund auf neu post-trainierte Modelle eine nicht-triviale Leistung auf Reasoning-Datensätzen erzielen können.

LLMs machine learning Benchmarking Training

RESEARCHarXiv CS.AI·vor 19Std

OmniMem: Perturbation-aware Memory Compression for Streaming Audio-Visual LLMs

OmniMem ist ein speichereffizientes Streaming-Framework für audiovisuelle LLMs, das entwickelt wurde, um die Einschränkungen der Langvideo-Inferenz aufgrund zunehmender Videotoken und KV-Caches zu überwinden. Es verwendet eine modalitätsbewusste Speicherzuweisung und eine störungsbewusste Speicherauswahl, um informative KV-Zustände zu erhalten, wodurch Komprimierung und Weitbereichsverständnis verbessert werden.

LLMs Audio-Visual AI deep learning Streaming

RESEARCHarXiv CS.CL·vor 19Std

TinyJudge: Unverifiable Constraint Alignment via Lightweight Specialist Ensembles

Der Artikel stellt TinyJudge vor, ein Framework, das ein Ensemble spezialisierter kleiner Sprachmodelle (0.6B) verwendet, um leichte und hochpräzise Belohnungen für weiche, nicht überprüfbare Einschränkungen bei der Befolgung von Anweisungen durch LLMs zu liefern. Dieser Ansatz behebt Engpässe wie Reward Hacking und hohen Rechenaufwand bei herkömmlichen LLM-as-a-Judge-Methoden zur Einschränkungsanpassung.

Tiny Models Model Alignment LLMs reinforcement learning

RESEARCHarXiv CS.CL·vor 19Std

ABLE: Representing and Mapping LLMs via Attribution-Based Large-model Embedding

ABLE (Attribution-Based Large-model Embedding) stellt ein Framework zur Darstellung großer Sprachmodelle vor, das den Interpretierbarkeitsraum nutzt. Es adressiert Herausforderungen beim systematischen Modellvergleich, indem es gradientenbasierte Feature-Attributionen aggregiert, um modellspezifische Eingabe-Empfindlichkeitsmuster zu erfassen.

LLMs model representation security model comparison

RESEARCHarXiv CS.CL·vor 19Std

BEACON: Behavioral Entropy Aggregation for Cross-Model Hallucination Detection in Large Language Models

Das Papier stellt BEACON vor, ein Black-Box-Framework zur Erkennung von Halluzinationen in LLMs, das ausschließlich auf Modellausgaben basiert. Es extrahiert einen 31-dimensionalen Feature-Vektor, und ein gradientenverstärkter Klassifikator erreicht 0,8123 AUROC, was bestehende Baselines übertrifft.

LLMs hallucination machine learning detection

ARTICLEDEV.to AI·vor 1T

Keeping a chat app's token bill flat as conversations grow

Dieser Artikel behandelt das Problem steigender Token-Kosten in KI-Chat-Anwendungen, wenn Gespräche länger werden, da der gesamte Gesprächsverlauf bei jeder Runde erneut gesendet wird. Es wird eine Lösung vorgestellt, die eine "rollierende Zusammenfassung" mit einem "wörtlichen Fenster" kombiniert, um die Token-Nutzung zu optimieren und die Kosten zu kontrollieren.

token management chatbots LLMs Cost Optimization

ARTICLEDEV.to AI·vor 2T

The Five Faculties: A Tour of SAFi's Cognitive Architecture

Der Inhalt stellt SAFi (Self-Alignment Framework Interface) vor, eine KI-Governance-Architektur, die von der üblichen prompt-basierten Ausrichtung abweicht, indem sie die Kognition auf fünf spezialisierte Fakultäten aufteilt. Dieses System zielt darauf ab, die Generierung, Evaluierung und Ausführung von KI zu entkoppeln, beginnend mit einer vorgenerierenden Sicherheitsbarriere, um Prompt-Injektionen und andere Bedrohungen zu verhindern.

AI architecture LLMs AI alignment security

ARTICLE↑ trendingHacker News (AI)·vor 5T

OpenAI CEO Sam Altman admits AI token costs are becoming 'an issue'

Sam Altman, CEO von OpenAI, gibt zu, dass die Kosten für KI-Token zu einem erheblichen Problem für das Unternehmen werden. OpenAI strebt eine verbesserte Wertschöpfung und Effizienz an, da die übermäßigen Ausgaben zu einem Meme geworden sind.

AI costs OpenAI LLMs efficiency