RESEARCH27

Memory Architectures for Multi-Turn Text-to-SQL: A Benchmark and Empirical Study

arXiv CS.CL·27 mai 2026

Cette recherche présente EnterpriseMem-Bench, un nouveau benchmark Text-to-SQL multi-tour avec 300 sessions et 1 400 tours issus de domaines d'entreprise. Elle évalue empiriquement cinq modèles de pointe, dont des variantes GPT et Claude, révélant que les modèles Text-to-SQL multi-tour sans état atteignent une précision d'exécution nulle dès le Tour 3.

memory architectures Text-to-SQL enterprise analytics Benchmarking large language models

Lire l'original ↗