← heapsort-ai

user interaction

4 items

ARTICLEDEV.to AI·1d atrás

Are You Talking to a Bot? Why AI Identity is Harder Than You Think

A rápida implantação de sistemas de IA agênticos levanta o desafio da identidade da IA, criando uma "Lacuna de Ambiguidade de Identidade" que representa riscos de segurança para os usuários. Pesquisadores desenvolveram o framework RealityTest para analisar como os modelos de IA lidam com questões de identidade em cenários reais, revelando a dificuldade de distinguir entre humanos e máquinas.

49
RESEARCHarXiv CS.CL·01/05/2026

Useless but Safe? Benchmarking Utility Recovery with User Intent Clarification in Multi-Turn Conversations

CarryOnBench é apresentado como o primeiro benchmark interativo para medir como LLMs recuperam a utilidade e revisam a interpretação da intenção do usuário em conversas seguras e multi-turno. Ele revela que os modelos atuais atendem apenas 10,5-37,6% das necessidades de informação benignas dos usuários na primeira rodada, destacando uma lacuna na recuperação de utilidade de LLMs alinhados à segurança.

27