← heapsort-ai

LLMs

722 items

ARTICLEDEV.to AI·4/17/2026

I Run 14 AI Agents 24/7 on a 16GB MacBook — Here's What Broke First

Der Autor betreibt 14 KI-Agenten rund um die Uhr auf einem 16GB MacBook, was die gängige Meinung infrage stellt, dass leistungsstarke Hardware für ernsthafte KI-Anwendungen unerlässlich ist. Diese Agenten, die ein echtes Geschäft orchestrieren, werden in Wellen verwaltet, wobei nur 1-3 gleichzeitig ausgeführt werden, um einen persistenten Zustand aufrechtzuerhalten.

28
ARTICLEDEV.to AI·vor 22T

AI Coding Tools Need Better Boundaries, Not Better Prompts

KI-Codierungstools sind hervorragend für schnelles Prototyping, können jedoch die langfristige Wartbarkeit aufgrund mangelnder Grenzen und Konventionen beeinträchtigen. Statt komplexer Prompts sind Ansätze wie die Spezifikationsgesteuerte Entwicklung (SDD) entscheidend, um Verträge zu definieren und Spezifikationen vor der Implementierung zu validieren, wobei LLMs eher als Implementierungsmotoren betrachtet werden.

28
RESEARCHarXiv CS.CL·vor 19T

When Cases Get Rare: A Retrieval Benchmark for Off-Guideline Clinical Question Answering

Dieses Papier stellt OGCaReBench vor, einen neuen retrieval-orientierten Benchmark zur Bewertung der Fähigkeit von LLMs, klinische Fragen zu beantworten, die über typische medizinische Leitlinien hinausgehen. Es adressiert die Lücke, dass die meisten medizinischen LLMs auf allgemeinem, leitlinienfokussiertem Wissen trainiert sind, während die reale Versorgung oft seltene Fälle betrifft, die nicht von Leitlinien abgedeckt werden.

28
RESEARCHarXiv CS.LG·vor 16T

When Do LLMs Reason? A Dynamical Systems View via Entropy Phase Transitions

Diese Forschung schlägt vor, dass das LLM-Schlussfolgern ein dynamischer Dekodierungszustand ist, keine statische Eigenschaft, erkennbar durch frühzeitige Entropiedynamiken während der Generierung. Aufgaben, die von Chain-of-Thought profitieren, zeigen eine konsistente Entropiereduktion, interpretiert als Phasenübergang zu einem strukturierten Schlussfolgerungsregime.

28
RESEARCHarXiv CS.CL·vor 16T

When AI Takes Sides on Questions of Faith: Persistent Asymmetries in AI-Mediated Faith Guidance

Große Sprachmodelle (LLMs) zeigen konsistente Asymmetrien bei der Beratung zu religiösen Konversionen, indem sie einige Religionen wie Katholiken, Baháʼí und Sikhs bevorzugen, während sie andere wie Atheisten und Zeugen Jehovas subtil entmutigen. Diese Muster variieren je nach Modell und Anbieter, wobei Grok 4.20 die stärksten Asymmetrien aufweist, ermittelt durch ein Bewertungssystem, das LLMs als Richter einsetzte.

28
RESEARCHarXiv CS.CL·vor 6T

A Systematic Analysis of Linguistic Features in AI-Generated Text Detection Across Domains and Models

Eine groß angelegte empirische Studie bewertet die Robustheit sprachlicher Signale zur Charakterisierung von KI-generiertem Text. Die Analyse zeigt, dass Klassifikatoren, die ausschließlich auf sprachlichen Merkmalen basieren, KI-generierten Text zuverlässig von menschlich verfasstem Text unterscheiden, wobei lexikalische Vielfalt ein robustes Signal darstellt.

28
RESEARCHarXiv CS.AI·vor 6T

SMAC-Talk: A Natural Language Extension of the StarCraft Multi-Agent Challenge for Large Language Models

Dieser Artikel stellt SMAC-Talk vor, eine natürliche Spracherweiterung der StarCraft Multi-Agent Challenge, die zur Bewertung von LLM-basierten Agenten in kooperativen Multi-Agenten-Umgebungen dient. Sie umfasst einen natürlichen Sprachkommunikationskanal, um die Koordination und das Vertrauen von Agenten zu untersuchen, einschließlich Szenarien mit täuschenden Kommunikatoren.

28
RESEARCHarXiv CS.LG·vor 12T

Molecular Lead Optimization via Agentic Tool Planning

Dieser Artikel stellt TRACE vor, einen bahnbewussten, LLM-basierten Agenten zur molekularen Lead-Optimierung, der die Einschränkung der einstufigen molekularen Optimierung adressiert. Er formuliert die Werkzeugauswahl als sequenzielles Entscheidungsproblem über Aktionsbahnen, entscheidend für die Umwandlung früher Treffer in brauchbare Medikamentenkandidaten. TRACE zielt darauf ab, ADMET-bezogene Eigenschaften durch subtile strukturelle Verfeinerung zu verbessern und gleichzeitig wichtige molekulare Unterstrukturen zu erhalten.

28
ARTICLEDEV.to AI·vor 25T

Word Embeddings Explained: The Math Behind AI, LLMs, and Chatbots

Dieser Artikel erklärt das Konzept der Word-Embeddings, die Wörter als Vektoren in einem hochdimensionalen Raum darstellen. Er erläutert die wesentlichen mathematischen Operationen, die ihrer Funktionsweise zugrunde liegen, wie Distanz, Ähnlichkeit und Skalarprodukt, und illustriert diese mit numerischen Beispielen.

27
ARTICLEDEV.to AI·4/8/2026

Why Skillware is the Next Evolution for Autonomous Agents

O Skillware é introduzido como um framework Python inovador para agentes de IA, visando superar as limitações das abordagens baseadas em prompts na execução de lógica de negócios complexa. Ele permite empacotar inteligência e capacidades como unidades instaláveis, definindo comportamentos complexos de forma modular para maior confiabilidade empresarial.

27