RESEARCH27
IntentGrasp: A Comprehensive Benchmark for Intent Understanding
arXiv CS.CL·11 de mayo de 2026
IntentGrasp es un nuevo benchmark integral para evaluar la capacidad de comprensión de intenciones de los LLM, derivado de 49 corpus de alta calidad. Evaluaciones extensivas en 20 LLM demostraron un rendimiento insatisfactorio, con puntuaciones inferiores al 60% en el All Set y al 25% en el Gem Set.
Leer original ↗