heapsort
RESEARCH28

PQR: A Framework to Generate Diverse and Realistic User Queries that Elicit QA Agent Failures

arXiv CS.CL·19 de mayo de 2026

Este artículo presenta PQR, un marco para generar consultas de usuario diversas y realistas que provocan fallos en agentes de QA basados en LLM, superando los métodos existentes que se centran en usuarios adversarios. PQR opera a través de módulos de refinamiento de consultas y prompts que iteran para crear escenarios de prueba realistas que exponen las vulnerabilidades de los agentes.

Leer original