RESEARCHarXiv CS.CL·vor 29T
Can LLMs Take Retrieved Information with a Grain of Salt?
Dieser Artikel bewertet die Fähigkeit großer Sprachmodelle (LLMs), ihre Antworten an die Sicherheit der abgerufenen Informationen anzupassen, und deckt systematische Einschränkungen auf. Er schlägt eine Interaktionsstrategie vor, die frühere Erinnerungen, Sicherheitsskalibrierung und Kontextvereinfachung kombiniert, um die Zuverlässigkeit von LLMs zu verbessern. Dieser Ansatz reduziert Gehorsamsfehler um 25%, ohne Modellgewichte zu ändern.
27