RESEARCH27

Memory Architectures for Multi-Turn Text-to-SQL: A Benchmark and Empirical Study

arXiv CS.CL·27 de mayo de 2026

Esta investigación introduce EnterpriseMem-Bench, un nuevo benchmark Text-to-SQL de múltiples turnos con 300 sesiones y 1.400 turnos de dominios empresariales. Evalúa empíricamente cinco modelos de vanguardia, incluyendo variantes de GPT y Claude, revelando que los modelos Text-to-SQL de múltiples turnos sin estado alcanzan una precisión de ejecución nula en el Turno 3.

memory architectures Text-to-SQL enterprise analytics Benchmarking large language models

Leer original ↗