RESEARCH28
EVA-Bench Data 2.0: 3 Domains, 121 Tools, 213 Scenarios
Hugging Face Blog·4. Juni 2026
EVA-Bench Data 2.0 stellt eine aktualisierte Benchmark-Version mit 3 Domänen, 121 Tools und 213 Szenarien vor. Dieser Datensatz ist für die Bewertung von KI-Systemen und -Tools konzipiert.
Original lesen ↗