← heapsort-ai

user interaction

4 items

ARTICLEDEV.to AI·vor 1T

Are You Talking to a Bot? Why AI Identity is Harder Than You Think

Die schnelle Bereitstellung agentischer KI-Systeme wirft die Herausforderung der KI-Identität auf und schafft eine "Identitätsambiguitätslücke", die Sicherheitsrisiken für Benutzer birgt. Forscher entwickelten das RealityTest-Framework, um zu analysieren, wie KI-Modelle Identitätsfragen in realen Szenarien handhaben, was die Schwierigkeit der Unterscheidung zwischen Mensch und Maschine offenbart.

49
RESEARCHarXiv CS.CL·5/1/2026

Useless but Safe? Benchmarking Utility Recovery with User Intent Clarification in Multi-Turn Conversations

CarryOnBench wird als erster interaktiver Benchmark eingeführt, um zu messen, wie LLMs in sicheren Multi-Turn-Gesprächen die Nützlichkeit wiederherstellen und die Interpretation der Benutzerabsicht anpassen. Er zeigt, dass aktuelle Modelle im ersten Zug nur 10,5-37,6% des gutartigen Informationsbedarfs der Benutzer erfüllen, was eine Lücke in der Nutzlichkeitswiederherstellung sicherheitsorientierter LLMs aufzeigt.

27