heapsort
RESEARCH27

AttuneBench: A Conversation-Based Benchmark for LLM Emotional Intelligence

arXiv CS.AI·23 de maio de 2026

AttuneBench é um novo benchmark baseado em 200 conversas genuínas multi-turnos entre humanos e modelos para avaliar a inteligência emocional de LLMs. Ele mede a capacidade dos modelos de inferir e responder a estados emocionais em conversas reais, revelando que as classificações de modelos em reconhecimento de emoções e outras métricas são amplamente independentes.

Ler original