← heapsort-ai

user interaction

4 items

ARTICLEDEV.to AI·il y a 1j

Are You Talking to a Bot? Why AI Identity is Harder Than You Think

Le déploiement rapide des systèmes d'IA agissant soulève le défi de l'identité de l'IA, créant un "Écart d'Ambigüité d'Identité" qui pose des risques de sécurité pour les utilisateurs. Des chercheurs ont développé le cadre RealityTest pour analyser comment les modèles d'IA gèrent les questions d'identité dans des scénarios réels, révélant la difficulté de distinguer les humains des machines.

49
RESEARCHarXiv CS.CL·01/05/2026

Useless but Safe? Benchmarking Utility Recovery with User Intent Clarification in Multi-Turn Conversations

CarryOnBench est introduit comme le premier benchmark interactif pour mesurer la capacité des LLM à retrouver leur utilité et à réviser l'interprétation de l'intention de l'utilisateur dans des conversations multi-tours sécurisées. Il révèle que les modèles actuels ne répondent qu'à 10,5-37,6% des besoins d'information bénins des utilisateurs au premier tour, soulignant une lacune dans la récupération d'utilité des LLM alignés sur la sécurité.

27