RESEARCH27

AttuneBench: A Conversation-Based Benchmark for LLM Emotional Intelligence

arXiv CS.AI·23 de maio de 2026

AttuneBench é um novo benchmark baseado em 200 conversas genuínas multi-turnos entre humanos e modelos para avaliar a inteligência emocional de LLMs. Ele mede a capacidade dos modelos de inferir e responder a estados emocionais em conversas reais, revelando que as classificações de modelos em reconhecimento de emoções e outras métricas são amplamente independentes.

Emotional Intelligence Benchmarks human-AI interaction AI evaluation LLM

Ler original ↗