heapsort
RESEARCH28

PQR: A Framework to Generate Diverse and Realistic User Queries that Elicit QA Agent Failures

arXiv CS.CL·19 de maio de 2026

O artigo apresenta PQR, uma estrutura para gerar consultas de usuário diversas e realistas que provocam falhas em agentes de QA baseados em LLM, superando os métodos existentes que focam em usuários adversários. O PQR funciona através de módulos de refinamento de consulta e de prompt que iteram para criar cenários de teste realistas que expõem as vulnerabilidades dos agentes.

Ler original