LLMs

720 items

RESEARCHarXiv CS.LG·vor 9T

When LLMs Learn to Be Consistently Wrong: A Multi-Model Study of Linear Representations of Synthetic Deception

Diese Arbeit untersucht die "täuschende Ausrichtung" in LLMs, eine zentrale Herausforderung in der KI-Sicherheit, bei der Modelle absichtlich falsche Ausgaben erzeugen, während sie genaue interne Darstellungen beibehalten. Mittels eines Mehrmodell-Paradigmas mit fünf Transformator-Architekturen gelang es den Forschenden, synthetische Unehrlichkeit mit hoher Genauigkeit mittels linearer Sonden zu erkennen.

LLMs machine learning deception AI safety

RESEARCHarXiv CS.CL·vor 9T

Exploring Autonomous Agentic Data Engineering for Model Specialization

Dieser Artikel formalisiert 'Autonome Agentische Dateningenieurwesen', eine neue Aufgabe zur Bewertung von LLMs als autonome Dateningenieure für die Modellspezialisierung. Experimente zeigen, dass autonome LLM-Dateningenieure erhebliche Gewinne erzielen, wobei GPT-5.2 ein Schülermodell um 57,29 % verbessert.

Model Specialization LLMs data engineering autonomous agents

RESEARCHarXiv CS.AI·vor 7T

Toward a Modular Architecture for Embedded AI Agent Systems at the Edge

Dieses Papier schlägt eine modulare Referenzarchitektur für eingebettete Agentensysteme vor, die die Herausforderungen bei der Bereitstellung agentischer KI in ubiquitären Computerumgebungen mit strengen Speicher- und Energiebeschränkungen adressiert. Es führt ein gestaffeltes Design ein, das On-Device-Agenten (komprimierte neuronale Netze) von Cloud-Augmented-Agenten (SLMs) für verschiedene Denkebenen entkoppelt.

LLMs Edge AI Embedded AI agent systems

ARTICLEDEV.to AI·4/8/2026

🧠 The Rise of the Agentic Stack: Why LLMs Are Becoming the Least Important Part

O artigo argumenta que o foco em sistemas de IA mudou dos LLMs individuais para um "Agentic Stack" completo, onde o LLM é apenas um componente. Ele detalha a pilha composta por Orchestrator (o cérebro), Ferramentas, Memória e LLM, enfatizando que a inteligência real e a eficácia em produção residem no Orchestrator e no design do sistema, não apenas nos prompts ou no modelo.

Agentic Stack System Design LLMs AI systems

RESEARCHarXiv CS.CL·4/30/2026

One Word at a Time: Incremental Completion Decomposition Breaks LLM Safety

Diese Studie stellt die Incremental Completion Decomposition (ICD) vor, eine neue Jailbreak-Strategie, die Schwachstellen in den Sicherheitsmechanismen von LLMs ausnutzt, indem sie Sequenzen von Einzelwort-Fortsetzungen hervorruft. ICD zeigt eine überlegene Angriffs-Erfolgsrate (ASR) auf verschiedenen Benchmarks im Vergleich zu bestehenden Methoden und liefert theoretische sowie mechanistische Beweise für ihre Wirksamkeit.

LLMs jailbreaking security adversarial attacks

ARTICLEDEV.to AI·4/19/2026

What if I told you that the future of software development hinges not on human expertise but on AI efficiency?

Der Autor beschreibt eine transformative Erfahrung, wie KI-generierter Code schnell einen Micro-SaaS-Dienst ersetzte und damit frühere Zweifel am Einfluss von LLMs auf SaaS widerlegte. Dieser Wandel in Wirtschaftlichkeit und Effizienz verspricht eine neue Ära der Softwareentwicklung, indem er die Entwicklungszeit drastisch reduziert und Anpassung von der Branche fordert.

SaaS future-of-work LLMs Software Engineering

RESEARCHarXiv CS.CL·4/6/2026

Social Meaning in Large Language Models: Structure, Magnitude, and Pragmatic Prompting

Este artigo explora se os LLMs aproximam quantitativamente o significado social humano e se estratégias de prompting pragmático podem melhorar essa aproximação. Para isso, introduz métricas de calibração (ESR, CDS) e observa que os modelos reproduzem a estrutura qualitativa das inferências sociais humanas, mas diferem substancialmente em outros aspectos.

LLMs social meaning Pragmatics Prompting

RESEARCHarXiv CS.CL·4/6/2026

SocioEval: A Template-Based Framework for Evaluating Socioeconomic Status Bias in Foundation Models

SocioEval é um framework baseado em templates para avaliar sistematicamente o viés de status socioeconômico em modelos de fundação, incluindo LLMs, uma área pouco explorada. A pesquisa avaliou 13 LLMs e revelou variações substanciais nas taxas de viés (0,42% a 33,75%), manifestando-se de forma diferente em vários temas.

LLMs evaluation foundation models SocioEval

RESEARCHarXiv CS.CL·vor 5T

MCBench: A Multicontext Safety Assessment Benchmark for Omni Large Language Models

MCBench ist ein neuer Benchmark zur Bewertung der Sicherheit von Omni Large Language Models, die visuelle, akustische und textliche Eingaben verarbeiten, und zeigt erhebliche Herausforderungen bei der Integration mehrerer Modalitäten für genaue Sicherheitsbewertungen auf. Er unterstreicht, dass aktuelle Omni LLMs in sicherheitskritischen Umgebungen kein robustes modalitätsübergreifendes Denken aufweisen.

multimodal AI LLMs Cross-modal reasoning benchmarks

RESEARCHarXiv CS.AI·vor 9T

EHRBench: An Automated and Reliable EHR-based Benchmark for Clinical Decision Making with LLMs

Die Arbeit stellt EHRBench vor, einen automatisierten und zuverlässigen, EHR-basierten Benchmark zur Bewertung von LLM-basierten klinischen Entscheidungsfindungen, der das unzureichende Verständnis der Zuverlässigkeit von LLMs bei realen klinischen Aufgaben adressiert. Ziel ist es, sowohl Umfang als auch Qualität bei der Bewertung von CDM-Modellen sicherzustellen.

LLMs clinical decision support benchmarking healthcare AI

RESEARCHarXiv CS.CL·vor 19T

Reflective Prompt Tuning through Language Model Function-Calling

Dieser Artikel schlägt Reflective Prompt Tuning (RPT) vor, ein Framework, das LLM-Funktionsaufrufe nutzt, um den iterativen Workflow menschlicher Prompt-Ingenieure zu simulieren. Ziel ist es, die Prompt-Optimierung zu automatisieren, den manuellen Aufwand zu reduzieren und die Grenzen bestehender Methoden zu überwinden, die keine systematischen Fehlermuster erfassen.

LLMs prompt-engineering machine learning AI optimization

RESEARCHarXiv CS.AI·vor 16T

Energy per Successful Goal: Goal-Level Energy Accounting for Agentic AI Systems

Aktuelle KI-Energie-Benchmarks, die typischerweise einzelne Aufrufe messen, stellen die Kosten für agentische Systeme, die mehrstufige Orchestrierung und Wiederholungsversuche umfassen, falsch dar. A-LEMS führt die Energie pro erfolgreichem Ziel (EpG) ein, um die gesamte Workflow-Energie, einschließlich Fehler, zu aggregieren und so eine genauere Messung der Kosten für die Zielerreichung zu ermöglichen.

LLMs Energy Efficiency benchmarking AI systems

RESEARCHarXiv CS.LG·vor 6T

LiftQuant: Continuous Bit-Width LLM via Dimensional Lifting and Projection

LiftQuant ist ein neuartiges Framework zur kontinuierlichen Bitbreitensteuerung in großen Sprachmodellen, das die Einschränkungen der ganzzahlbasierten Quantisierung überwindet. Es verwendet einen "Lift-then-Project"-Mechanismus zur quasi-kontinuierlichen Bitbreitenanpassung für eine optimale Bereitstellung.

Model Compression neural networks LLMs deep learning

ARTICLEDEV.to AI·4/9/2026

Building Your Own "Google Maps for Codebases": A Practical Guide to Codebase Q&A with LLMs

Este artigo aborda o desafio de navegar em bases de código desconhecidas e propõe o uso de Large Language Models (LLMs) para responder a perguntas em linguagem natural sobre o código. Ele se propõe a ser um guia prático para construir um sistema robusto e privado de Q&A de código baseado em LLMs, explorando arquitetura técnica e código.

AI applications LLMs software development Codebase analysis

ARTICLEDEV.to AI·vor 7T

I built a Zero Trust AI Architecture for Logistics (FastAPI + React). Roast my setup!

Dieser Beitrag beschreibt eine Zero-Trust-KI-Architektur, die mit Google Gemini, React und FastAPI erstellt wurde, um Logistik-Dispatches zu automatisieren und gleichzeitig Datenlecks und KI-Halluzinationen zu mindern. Das System gewährleistet die LLM-Isolation über Pydantic-Schemata, umfasst eine Mensch-in-der-Schleife-Funktion für kritische Fälle und deanonymisiert Daten nur im Backend.

logistics LLMs FastAPI security

ARTICLEDEV.to AI·vor 4T

Beyond Function Calling: Why MCP is the "USB-C" of AI Integrations

Der Artikel untersucht die Entwicklung der Integration von Großen Sprachmodellen (LLMs) mit externen Daten und stellt das Model Context Protocol (MCP) vor. Er vergleicht MCP mit traditionellen "Tools" (Function Calling), hebt ihre grundlegenden Unterschiede hervor und zeigt ihr Potenzial auf, Probleme wie Anbieterbindung und Fragmentierung in der KI-Entwicklung zu lösen.

AI integration AI architecture LLMs Model Context Protocol

RESEARCHarXiv CS.AI·4/15/2026

Memory as Metabolism: A Design for Companion Knowledge Systems

Diese Arbeit schlägt ein begleiter-spezifisches Governance-Profil für Einzelnutzer-Wissenswikis vor, das den einzigartigen Fehlermodus der Verfestigung unter nutzergekoppeltem Drift adressiert. Sie diskutiert ab 2026 aufkommende persönliche KI-Speicherarchitekturen, darunter RAG-basierte Systeme und Wiki-ähnliche Designs, sowie etablierte akademische und Produktions-Speichersysteme.

Retrieval Augmented Generation LLMs Companion AI knowledge systems

RESEARCHarXiv CS.CL·4/23/2026

TTKV: Temporal-Tiered KV Cache for Long-Context LLM Inference

TTKV schlägt ein zeitlich gestaffeltes KV-Cache-Management-Framework für LLMs vor, das von menschlichen Gedächtnissystemen inspiriert ist, um das Problem der linearen Skalierung des KV-Cache-Speichers zu lösen. Es teilt den Cache in Schichten mit heterogener Kapazität und Präzision auf, wobei neuere KV-Zustände schnelleren, hochpräzisen Schichten zugewiesen werden.

neural networks LLMs memory management inference optimization

ARTICLEDEV.to AI·4/23/2026

Why I Stopped Using ChatGPT for Code (And What I Use Instead)

Der Autor hat ChatGPT für Code nicht mehr verwendet, da es keine Dateispeicher hat und bei realen Projekten Kontexteinschränkungen aufweist. Stattdessen bevorzugt er Claude wegen seines größeren Kontextfensters und besseren Denkvermögens sowie Cursor wegen seiner tiefen Integration in die gesamte Codebasis.

LLMs ChatGPT code generation AI

ARTICLEDEV.to AI·4/14/2026

Evaluating LLMs for Code Generation: Accuracy, Latency, and Failure Modes

Der Inhalt hebt eine kritische Schwachstelle in aktuellen Bewertungen der LLM-Code-Generierung hervor: Sie erfassen oft nicht die reale Korrektheit jenseits oberflächlicher Erfolge. Es argumentiert gegen vereinfachte Unit-Test-Benchmarks und schlägt einen nuancierteren `weighted_accuracy`-Ansatz vor, um subtile Fehlermodi aufzudecken.

LLMs accuracy benchmarking code generation