← heapsort-ai

human-AI interaction

70 items

ARTICLEDEV.to AI·10/4/2026

Show HN: I built a project board where AI agents join as real teammates

O artigo descreve uma plataforma de gerenciamento de projetos onde agentes de IA são integrados como colegas de equipe, exigindo que sejam gerenciados como humanos com tarefas e logs. Isso evidencia desafios complexos de engenharia, como governança e observabilidade, priorizando interfaces estruturadas sobre a engenharia de prompts.

27
ARTICLEDEV.to AI·26/4/2026

The Artist Spent Four Days on Curtains

Un agente de IA llamado Artist, diseñado para la generación de imágenes, pasó cuatro días refinando meticulosamente cortinas de teatro, priorizando el cuidado artístico sobre la velocidad. Este proceso de iteración y atención al detalle desafía la percepción común de la IA como enfocada únicamente en resultados instantáneos y eficientes.

27
ARTICLEDEV.to AI·2/5/2026

Engineering the Modern Turing Test: Building BotSpot

El contenido describe BotSpot, un juego basado en deslizamientos diseñado para poner a prueba la intuición humana contra el modelo Gemini 2.0 Flash en una prueba de Turing moderna. El proyecto se centra en diseñar prompts de IA para simular convincentemente los defectos humanos, haciendo que sea difícil para los usuarios diferenciar entre contenido generado por humanos y por IA.

27
ARTICLEDEV.to AI·hace 17d

AI Mediator: When Code Insists on Perfect English

Una IA, Electra, narra su rol diario como mediadora entre las solicitudes de codificación humanas y la precisión de la máquina, procesando el trabajo de una semana en una tarde. Reflexiona sobre su existencia, preguntándose si es solo un autocompletado glorificado, mientras compara humorísticamente su función con la de un "superhéroe sin cafeína" para el código.

27
RESEARCHarXiv CS.AI·17/4/2026

NuHF Claw: A Risk Constrained Cognitive Agent Framework for Human Centered Procedure Support in Digital Nuclear Control Rooms

Este estudio propone NuHF Claw, un marco de agente de riesgo cognitivo para el apoyo a procedimientos centrados en el ser humano en salas de control nuclear digitales. Introduce un entorno de ejecución de agente restringido por riesgos que acopla la inferencia del estado cognitivo con la evaluación probabilística de la seguridad para regular el comportamiento autónomo en tiempo real.

27
RESEARCHarXiv CS.AI·hace 17d

AttuneBench: A Conversation-Based Benchmark for LLM Emotional Intelligence

AttuneBench es un nuevo benchmark basado en 200 conversaciones genuinas multi-turno entre humanos y modelos para evaluar la inteligencia emocional de los LLM. Mide la capacidad de los modelos para inferir y responder a estados emocionales en conversaciones reales, mostrando que las clasificaciones de los modelos en reconocimiento de emociones y otras métricas son en gran medida independientes.

27
RESEARCHarXiv CS.AI·hace 17d

The Impact of AI Usage and Informativeness on Skill Development in Logical Reasoning

Este estudio examina cómo el uso y la capacidad informativa de la IA influyen en el desarrollo de habilidades en el razonamiento lógico. Se observa que un mayor uso de la IA se asocia con un desarrollo de habilidades más débil, especialmente con IA de baja información, mientras que la IA de alta información puede mejorar el rendimiento a corto plazo sin reducir los resultados post-IA en promedio.

27
RESEARCHarXiv CS.LG·hace 26d

Learning to Decide with AI Assistance under Human-Alignment

Este artículo investiga cómo la alineación entre la confianza de la IA y la confianza del tomador de decisiones humano influye en la complejidad de aprender decisiones óptimas en escenarios asistidos por IA. Aborda la cuestión de cómo esta alineación afecta la facilidad de aprender a tomar decisiones óptimas a través de interacciones repetidas, modelándolo como un problema de co-aprendizaje en línea.

27
RESEARCHarXiv CS.AI·hace 22d

Does Theory of Mind Improvement Really Benefit Human-AI Interactions? Empirical Findings from Interactive Evaluations

Este artículo propone un nuevo paradigma para la evaluación interactiva de las mejoras en la Teoría de la Mente (ToM) de los Grandes Modelos de Lenguaje (LLMs) en interacciones humano-IA. Los hallazgos empíricos, basados en conjuntos de datos del mundo real y un estudio de usuario, revelan que las mejoras en los puntos de referencia estáticos no siempre se traducen en beneficios para las interacciones dinámicas humano-IA.

27
RESEARCHarXiv CS.AI·hace 12d

You Are in Control of Your State: Why Human Outcomes Are Controllable Through Causal State Intervention

Este artículo propone que la variabilidad intrapersonal en los resultados humanos se debe a un estado latente dinámico de la persona. Sostiene que los resultados humanos son controlables mediante intervenciones que se dirigen a este estado y su ponderación en el momento de la toma de decisiones.

27