← heapsort-ai

user interaction

4 items

ARTICLEDEV.to AI·hace 1d

Are You Talking to a Bot? Why AI Identity is Harder Than You Think

La rápida implementación de sistemas de IA agénticos plantea el desafío de la identidad de la IA, creando una "Brecha de Ambigüedad de Identidad" que representa riesgos de seguridad para los usuarios. Investigadores desarrollaron el marco RealityTest para analizar cómo los modelos de IA manejan las preguntas de identidad en escenarios del mundo real, revelando la dificultad de distinguir entre humanos y máquinas.

49
RESEARCHarXiv CS.CL·1/5/2026

Useless but Safe? Benchmarking Utility Recovery with User Intent Clarification in Multi-Turn Conversations

CarryOnBench se presenta como el primer benchmark interactivo para medir cómo los LLM recuperan la utilidad y revisan la interpretación de la intención del usuario en conversaciones seguras de múltiples turnos. Revela que los modelos actuales satisfacen solo entre el 10,5% y el 37,6% de las necesidades de información benignas del usuario en el primer turno, lo que subraya una brecha en la recuperación de utilidad de los LLM alineados con la seguridad.

27