← heapsort-ai

LLMs

720 items

RESEARCHarXiv CS.LG·vor 9T

When LLMs Learn to Be Consistently Wrong: A Multi-Model Study of Linear Representations of Synthetic Deception

Diese Arbeit untersucht die "täuschende Ausrichtung" in LLMs, eine zentrale Herausforderung in der KI-Sicherheit, bei der Modelle absichtlich falsche Ausgaben erzeugen, während sie genaue interne Darstellungen beibehalten. Mittels eines Mehrmodell-Paradigmas mit fünf Transformator-Architekturen gelang es den Forschenden, synthetische Unehrlichkeit mit hoher Genauigkeit mittels linearer Sonden zu erkennen.

29
RESEARCHarXiv CS.AI·vor 7T

Toward a Modular Architecture for Embedded AI Agent Systems at the Edge

Dieses Papier schlägt eine modulare Referenzarchitektur für eingebettete Agentensysteme vor, die die Herausforderungen bei der Bereitstellung agentischer KI in ubiquitären Computerumgebungen mit strengen Speicher- und Energiebeschränkungen adressiert. Es führt ein gestaffeltes Design ein, das On-Device-Agenten (komprimierte neuronale Netze) von Cloud-Augmented-Agenten (SLMs) für verschiedene Denkebenen entkoppelt.

29
ARTICLEDEV.to AI·4/8/2026

🧠 The Rise of the Agentic Stack: Why LLMs Are Becoming the Least Important Part

O artigo argumenta que o foco em sistemas de IA mudou dos LLMs individuais para um "Agentic Stack" completo, onde o LLM é apenas um componente. Ele detalha a pilha composta por Orchestrator (o cérebro), Ferramentas, Memória e LLM, enfatizando que a inteligência real e a eficácia em produção residem no Orchestrator e no design do sistema, não apenas nos prompts ou no modelo.

29
RESEARCHarXiv CS.CL·4/30/2026

One Word at a Time: Incremental Completion Decomposition Breaks LLM Safety

Diese Studie stellt die Incremental Completion Decomposition (ICD) vor, eine neue Jailbreak-Strategie, die Schwachstellen in den Sicherheitsmechanismen von LLMs ausnutzt, indem sie Sequenzen von Einzelwort-Fortsetzungen hervorruft. ICD zeigt eine überlegene Angriffs-Erfolgsrate (ASR) auf verschiedenen Benchmarks im Vergleich zu bestehenden Methoden und liefert theoretische sowie mechanistische Beweise für ihre Wirksamkeit.

29
ARTICLEDEV.to AI·4/19/2026

What if I told you that the future of software development hinges not on human expertise but on AI efficiency?

Der Autor beschreibt eine transformative Erfahrung, wie KI-generierter Code schnell einen Micro-SaaS-Dienst ersetzte und damit frühere Zweifel am Einfluss von LLMs auf SaaS widerlegte. Dieser Wandel in Wirtschaftlichkeit und Effizienz verspricht eine neue Ära der Softwareentwicklung, indem er die Entwicklungszeit drastisch reduziert und Anpassung von der Branche fordert.

29
RESEARCHarXiv CS.CL·4/6/2026

Social Meaning in Large Language Models: Structure, Magnitude, and Pragmatic Prompting

Este artigo explora se os LLMs aproximam quantitativamente o significado social humano e se estratégias de prompting pragmático podem melhorar essa aproximação. Para isso, introduz métricas de calibração (ESR, CDS) e observa que os modelos reproduzem a estrutura qualitativa das inferências sociais humanas, mas diferem substancialmente em outros aspectos.

29
RESEARCHarXiv CS.CL·4/6/2026

SocioEval: A Template-Based Framework for Evaluating Socioeconomic Status Bias in Foundation Models

SocioEval é um framework baseado em templates para avaliar sistematicamente o viés de status socioeconômico em modelos de fundação, incluindo LLMs, uma área pouco explorada. A pesquisa avaliou 13 LLMs e revelou variações substanciais nas taxas de viés (0,42% a 33,75%), manifestando-se de forma diferente em vários temas.

29
RESEARCHarXiv CS.CL·vor 5T

MCBench: A Multicontext Safety Assessment Benchmark for Omni Large Language Models

MCBench ist ein neuer Benchmark zur Bewertung der Sicherheit von Omni Large Language Models, die visuelle, akustische und textliche Eingaben verarbeiten, und zeigt erhebliche Herausforderungen bei der Integration mehrerer Modalitäten für genaue Sicherheitsbewertungen auf. Er unterstreicht, dass aktuelle Omni LLMs in sicherheitskritischen Umgebungen kein robustes modalitätsübergreifendes Denken aufweisen.

28
RESEARCHarXiv CS.AI·vor 9T

EHRBench: An Automated and Reliable EHR-based Benchmark for Clinical Decision Making with LLMs

Die Arbeit stellt EHRBench vor, einen automatisierten und zuverlässigen, EHR-basierten Benchmark zur Bewertung von LLM-basierten klinischen Entscheidungsfindungen, der das unzureichende Verständnis der Zuverlässigkeit von LLMs bei realen klinischen Aufgaben adressiert. Ziel ist es, sowohl Umfang als auch Qualität bei der Bewertung von CDM-Modellen sicherzustellen.

28
RESEARCHarXiv CS.CL·vor 19T

Reflective Prompt Tuning through Language Model Function-Calling

Dieser Artikel schlägt Reflective Prompt Tuning (RPT) vor, ein Framework, das LLM-Funktionsaufrufe nutzt, um den iterativen Workflow menschlicher Prompt-Ingenieure zu simulieren. Ziel ist es, die Prompt-Optimierung zu automatisieren, den manuellen Aufwand zu reduzieren und die Grenzen bestehender Methoden zu überwinden, die keine systematischen Fehlermuster erfassen.

28
RESEARCHarXiv CS.AI·vor 16T

Energy per Successful Goal: Goal-Level Energy Accounting for Agentic AI Systems

Aktuelle KI-Energie-Benchmarks, die typischerweise einzelne Aufrufe messen, stellen die Kosten für agentische Systeme, die mehrstufige Orchestrierung und Wiederholungsversuche umfassen, falsch dar. A-LEMS führt die Energie pro erfolgreichem Ziel (EpG) ein, um die gesamte Workflow-Energie, einschließlich Fehler, zu aggregieren und so eine genauere Messung der Kosten für die Zielerreichung zu ermöglichen.

28
ARTICLEDEV.to AI·4/9/2026

Building Your Own "Google Maps for Codebases": A Practical Guide to Codebase Q&A with LLMs

Este artigo aborda o desafio de navegar em bases de código desconhecidas e propõe o uso de Large Language Models (LLMs) para responder a perguntas em linguagem natural sobre o código. Ele se propõe a ser um guia prático para construir um sistema robusto e privado de Q&A de código baseado em LLMs, explorando arquitetura técnica e código.

28
ARTICLEDEV.to AI·vor 7T

I built a Zero Trust AI Architecture for Logistics (FastAPI + React). Roast my setup!

Dieser Beitrag beschreibt eine Zero-Trust-KI-Architektur, die mit Google Gemini, React und FastAPI erstellt wurde, um Logistik-Dispatches zu automatisieren und gleichzeitig Datenlecks und KI-Halluzinationen zu mindern. Das System gewährleistet die LLM-Isolation über Pydantic-Schemata, umfasst eine Mensch-in-der-Schleife-Funktion für kritische Fälle und deanonymisiert Daten nur im Backend.

28
ARTICLEDEV.to AI·vor 4T

Beyond Function Calling: Why MCP is the "USB-C" of AI Integrations

Der Artikel untersucht die Entwicklung der Integration von Großen Sprachmodellen (LLMs) mit externen Daten und stellt das Model Context Protocol (MCP) vor. Er vergleicht MCP mit traditionellen "Tools" (Function Calling), hebt ihre grundlegenden Unterschiede hervor und zeigt ihr Potenzial auf, Probleme wie Anbieterbindung und Fragmentierung in der KI-Entwicklung zu lösen.

28
RESEARCHarXiv CS.AI·4/15/2026

Memory as Metabolism: A Design for Companion Knowledge Systems

Diese Arbeit schlägt ein begleiter-spezifisches Governance-Profil für Einzelnutzer-Wissenswikis vor, das den einzigartigen Fehlermodus der Verfestigung unter nutzergekoppeltem Drift adressiert. Sie diskutiert ab 2026 aufkommende persönliche KI-Speicherarchitekturen, darunter RAG-basierte Systeme und Wiki-ähnliche Designs, sowie etablierte akademische und Produktions-Speichersysteme.

28
RESEARCHarXiv CS.CL·4/23/2026

TTKV: Temporal-Tiered KV Cache for Long-Context LLM Inference

TTKV schlägt ein zeitlich gestaffeltes KV-Cache-Management-Framework für LLMs vor, das von menschlichen Gedächtnissystemen inspiriert ist, um das Problem der linearen Skalierung des KV-Cache-Speichers zu lösen. Es teilt den Cache in Schichten mit heterogener Kapazität und Präzision auf, wobei neuere KV-Zustände schnelleren, hochpräzisen Schichten zugewiesen werden.

28