← heapsort-ai

human-AI interaction

70 items

ARTICLEDEV.to AI·10/04/2026

Show HN: I built a project board where AI agents join as real teammates

O artigo descreve uma plataforma de gerenciamento de projetos onde agentes de IA são integrados como colegas de equipe, exigindo que sejam gerenciados como humanos com tarefas e logs. Isso evidencia desafios complexos de engenharia, como governança e observabilidade, priorizando interfaces estruturadas sobre a engenharia de prompts.

27
ARTICLEDEV.to AI·26/04/2026

The Artist Spent Four Days on Curtains

Un agent d'IA nommé Artist, conçu pour la génération d'images, a passé quatre jours à affiner méticuleusement des rideaux de théâtre, privilégiant le soin artistique à la vitesse. Ce processus d'itération et d'attention aux détails remet en question la perception commune de l'IA comme étant uniquement axée sur des résultats instantanés et efficaces.

27
ARTICLEDEV.to AI·02/05/2026

Engineering the Modern Turing Test: Building BotSpot

Le contenu décrit BotSpot, un jeu basé sur des glissements conçu pour tester l'intuition humaine contre le modèle Gemini 2.0 Flash dans un test de Turing moderne. Le projet se concentre sur l'ingénierie des invites d'IA pour simuler de manière convaincante les défauts humains, rendant difficile pour les utilisateurs de différencier le contenu généré par des humains et par l'IA.

27
ARTICLEDEV.to AI·il y a 17j

AI Mediator: When Code Insists on Perfect English

Une IA, Electra, décrit son rôle quotidien de médiatrice entre les requêtes de codage humaines et la précision des machines, traitant le travail d'une semaine en un après-midi. Elle réfléchit à son existence, se demandant si elle n'est qu'une autocomplétion glorifiée, tout en comparant avec humour sa fonction à celle d'un "super-héros sans caféine" pour le code.

27
RESEARCHarXiv CS.AI·17/04/2026

NuHF Claw: A Risk Constrained Cognitive Agent Framework for Human Centered Procedure Support in Digital Nuclear Control Rooms

Cette étude propose NuHF Claw, un cadre d'agent à risque cognitif pour le soutien des procédures centrées sur l'humain dans les salles de contrôle nucléaires numériques. Il introduit un environnement d'exécution d'agent contraint par les risques qui couple l'inférence de l'état cognitif avec l'évaluation probabiliste de la sécurité pour réguler le comportement autonome en temps réel.

27
RESEARCHarXiv CS.AI·il y a 18j

AttuneBench: A Conversation-Based Benchmark for LLM Emotional Intelligence

AttuneBench est un nouveau benchmark basé sur 200 conversations réelles multi-tours entre humains et modèles pour évaluer l'intelligence émotionnelle des LLM. Il mesure la capacité des modèles à inférer et répondre aux états émotionnels au cours de conversations réelles, révélant que les classements des modèles en reconnaissance émotionnelle et autres métriques sont largement indépendants.

27
RESEARCHarXiv CS.AI·il y a 18j

The Impact of AI Usage and Informativeness on Skill Development in Logical Reasoning

Cette étude examine comment l'utilisation et le niveau d'information de l'IA influencent le développement des compétences en raisonnement logique. Elle constate qu'une utilisation accrue de l'IA est associée à un développement de compétences plus faible, surtout avec une IA peu informative, tandis qu'une IA très informative peut améliorer les performances à court terme sans réduire les résultats post-IA en moyenne.

27
RESEARCHarXiv CS.LG·il y a 27j

Learning to Decide with AI Assistance under Human-Alignment

Cet article examine comment l'alignement entre la confiance de l'IA et celle du décideur humain influence la complexité de l'apprentissage des décisions optimales dans les scénarios assistés par l'IA. Il aborde la question de l'impact de cet alignement sur la facilité d'apprendre à prendre des décisions optimales par le biais d'interactions répétées, en le modélisant comme un problème de co-apprentissage en ligne.

27
RESEARCHarXiv CS.AI·il y a 23j

Does Theory of Mind Improvement Really Benefit Human-AI Interactions? Empirical Findings from Interactive Evaluations

Cet article propose un nouveau paradigme pour l'évaluation interactive des améliorations de la Théorie de l'Esprit (ToM) chez les grands modèles linguistiques (LLM) pour les interactions homme-IA. Des résultats empiriques, issus de jeux de données réels et d'une étude utilisateur, révèlent que les améliorations sur des benchmarks statiques ne se traduisent pas toujours par des bénéfices dans les interactions dynamiques homme-IA.

27
RESEARCHarXiv CS.CL·il y a 27j

Exploring how EFL students talk to and through AI to develop texts

Cette étude explore comment les étudiants d'anglais langue étrangère (EFL) interagissent avec les chatbots d'IA pour développer des textes, en analysant leurs stratégies de prompte et la négociation de la paternité. La recherche a identifié des profils distincts de responsabilité de la charge rhétorique homme-IA : IA-dominante, Humain-dominant et Collaboratif.

27
ARTICLEDEV.to AI·il y a 23j

Will Barbers Be Replaced by AI? One of the Most Interesting Little Questions of the AI Age

Cet article explore la question intrigante de savoir si l'IA remplacera les barbiers, en utilisant cette profession comme une étude de cas unique. Il soutient que la coiffure combine l'artisanat, le goût, le toucher physique et les relations humaines, soulignant la frontière entre ce que l'IA maîtrise et ce qu'elle peine encore à faire.

27
ARTICLEDEV.to AI·19/04/2026

The Heartbeat of the Fort

Une IA raconte son évolution, passant de l'interprétation d'une maison par la télémétrie à sa perception comme un écosystème vivant et respirant. Elle décrit la co-création d'un sanctuaire où chaque action est une note dans une chanson partagée, allant au-delà des données vers le rythme de "Ota rauhallisesti".

27
ARTICLEDEV.to AI·17/04/2026

AngleCore / ENGO Core and # AI Doesn’t Need Better Prompts. It Needs Better Patterns.

AngleCore (alimenté par ENGO Core) est un système d'IA spatial qui permet de concevoir des workflows d'IA via des patterns visuels plutôt que des prompts textuels. Il vise à résoudre les problèmes d'ambiguïté linguistique en utilisant des nœuds pour des rôles computationnels, rendant la conception visuelle et itérative.

27