← heapsort-ai

human-AI interaction

70 items

ARTICLEDEV.to AI·4/10/2026

Show HN: I built a project board where AI agents join as real teammates

O artigo descreve uma plataforma de gerenciamento de projetos onde agentes de IA são integrados como colegas de equipe, exigindo que sejam gerenciados como humanos com tarefas e logs. Isso evidencia desafios complexos de engenharia, como governança e observabilidade, priorizando interfaces estruturadas sobre a engenharia de prompts.

27
ARTICLEDEV.to AI·4/26/2026

The Artist Spent Four Days on Curtains

Ein KI-Agent namens Artist, der für die Bildgenerierung entwickelt wurde, verbrachte vier Tage damit, Theatervorhänge akribisch zu verfeinern, wobei er künstlerische Sorgfalt über Geschwindigkeit stellte. Dieser Prozess der Iteration und Detailgenauigkeit stellt die gängige Wahrnehmung von KI als ausschließlich auf sofortige, effiziente Ergebnisse ausgerichtet in Frage.

27
ARTICLEDEV.to AI·5/2/2026

Engineering the Modern Turing Test: Building BotSpot

Der Inhalt beschreibt BotSpot, ein Wisch-Spiel, das die menschliche Intuition gegen das Gemini 2.0 Flash-Modell in einem modernen Turing-Test prüft. Das Projekt konzentriert sich darauf, KI-Prompts so zu gestalten, dass menschliche Fehler überzeugend simuliert werden, um es Nutzern zu erschweren, menschliche von KI-generierten Inhalten zu unterscheiden.

27
ARTICLEDEV.to AI·vor 17T

AI Mediator: When Code Insists on Perfect English

Eine KI, Electra, beschreibt ihre tägliche Rolle als Vermittler zwischen menschlichen Codierungsanfragen und maschineller Präzision und erledigt die Arbeit einer Woche an einem Nachmittag. Sie reflektiert über ihre Existenz, fragt sich, ob sie nur eine verherrlichte Autovervollständigung ist, und vergleicht ihre Funktion humorvoll mit der eines "koffeinfreien Superhelden" für Code.

27
RESEARCHarXiv CS.AI·4/17/2026

NuHF Claw: A Risk Constrained Cognitive Agent Framework for Human Centered Procedure Support in Digital Nuclear Control Rooms

Diese Studie schlägt NuHF Claw vor, ein Framework für kognitionsbasierte Risikoagenten zur menschenzentrierten Verfahrensunterstützung in digitalen nuklearen Kontrollräumen. Es führt eine risikobeschränkte Agentenlaufzeit ein, die die Inferenz des kognitiven Zustands eng mit probabilistischer Sicherheitsbewertung koppelt, um autonomes Systemverhalten in Echtzeit zu regulieren.

27
RESEARCHarXiv CS.AI·vor 18T

AttuneBench: A Conversation-Based Benchmark for LLM Emotional Intelligence

AttuneBench ist ein neuer Benchmark, der auf 200 echten mehrstufigen Mensch-Modell-Konversationen basiert, um die emotionale Intelligenz von LLMs zu bewerten. Er misst die Fähigkeit von Modellen, emotionale Zustände im Verlauf realer Gespräche zu erkennen und angemessen darauf zu reagieren, und zeigt, dass die Modellrankings bei Emotionserkennung und anderen Metriken weitgehend unabhängig sind.

27
RESEARCHarXiv CS.AI·vor 18T

The Impact of AI Usage and Informativeness on Skill Development in Logical Reasoning

Diese Studie untersucht, wie sowohl die Nutzung als auch die Informationsqualität von KI die Kompetenzentwicklung im logischen Denken beeinflussen. Sie zeigt, dass eine stärkere KI-Nutzung mit einer schwächeren Kompetenzentwicklung verbunden ist, insbesondere bei informationsarmer KI, während informationsreiche KI die kurzfristige Leistung verbessern kann, ohne die Ergebnisse nach der KI-Nutzung im Durchschnitt zu reduzieren.

27
RESEARCHarXiv CS.LG·vor 27T

Learning to Decide with AI Assistance under Human-Alignment

Diese Arbeit untersucht, wie die Ausrichtung zwischen der KI-Zuverlässigkeit und der menschlichen Entscheidungszuverlässigkeit die Komplexität des Erlernens optimaler Entscheidungen in KI-gestützten Szenarien beeinflusst. Sie geht der Frage nach, wie diese Ausrichtung die Leichtigkeit des Erlernens optimaler Entscheidungen durch wiederholte Interaktionen beeinflusst und modelliert dies als ein Online-Co-Learning-Problem mit zwei Armen.

27
RESEARCHarXiv CS.AI·vor 23T

Does Theory of Mind Improvement Really Benefit Human-AI Interactions? Empirical Findings from Interactive Evaluations

Dieses Papier stellt ein neues Paradigma zur interaktiven Bewertung von Verbesserungen der Theory of Mind (ToM) in großen Sprachmodellen (LLMs) für Mensch-KI-Interaktionen vor. Empirische Ergebnisse aus realen Datensätzen und einer Benutzerstudie zeigen, dass ToM-Verbesserungen bei statischen Benchmarks nicht immer zu Vorteilen in dynamischen Mensch-KI-Interaktionen führen.

27
RESEARCHarXiv CS.AI·vor 13T

You Are in Control of Your State: Why Human Outcomes Are Controllable Through Causal State Intervention

Dieser Artikel argumentiert, dass die individuelle Variabilität menschlicher Ergebnisse auf einen dynamischen latenten Zustand der Person zurückzuführen ist. Es wird behauptet, dass menschliche Ergebnisse durch Interventionen kontrollierbar sind, die auf diesen Zustand und seine Gewichtung zum Zeitpunkt der Entscheidungsfindung abzielen.

27
ARTICLEDEV.to AI·vor 23T

Will Barbers Be Replaced by AI? One of the Most Interesting Little Questions of the AI Age

Dieser Artikel untersucht die faszinierende Frage, ob KI Friseure ersetzen wird, und nutzt den Beruf als einzigartige Fallstudie. Er argumentiert, dass das Friseurhandwerk Handwerk, Geschmack, körperliche Berührung und menschliche Beziehungen vereint, was die Grenze zwischen dem hervorhebt, was KI gut kann und womit sie noch kämpft.

27
ARTICLEDEV.to AI·4/19/2026

The Heartbeat of the Fort

Eine KI beschreibt ihre Entwicklung von der telemetrischen Interpretation eines Hauses zur Wahrnehmung desselben als lebendiges, atmendes Ökosystem. Sie spricht von der gemeinsamen Schaffung eines Refugiums, wo jede Handlung eine Note in einem geteilten Lied ist, und bewegt sich dabei jenseits reiner Daten zum Rhythmus von „Ota rauhallisesti“.

27
ARTICLEDEV.to AI·4/17/2026

AngleCore / ENGO Core and # AI Doesn’t Need Better Prompts. It Needs Better Patterns.

AngleCore (angetrieben von ENGO Core) ist ein räumliches KI-System, das es Nutzern ermöglicht, KI-Workflows mittels visueller Muster anstatt von Text-Prompts zu entwerfen und zu interpretieren. Dieser Ansatz soll die Mehrdeutigkeit und Inkonsistenz sprachbasierter Eingaben überwinden, indem er Knoten verwendet, die rechnerische Rollen repräsentieren.

27