RESEARCH28
PQR: A Framework to Generate Diverse and Realistic User Queries that Elicit QA Agent Failures
arXiv CS.CL·19 de mayo de 2026
Este artículo presenta PQR, un marco para generar consultas de usuario diversas y realistas que provocan fallos en agentes de QA basados en LLM, superando los métodos existentes que se centran en usuarios adversarios. PQR opera a través de módulos de refinamiento de consultas y prompts que iteran para crear escenarios de prueba realistas que exponen las vulnerabilidades de los agentes.
Leer original ↗