RESEARCH27
OmniToM: Benchmarking Theory of Mind in LLMs via Explicit Belief Modeling
arXiv CS.AI·27. Mai 2026
OmniToM ist ein neuer Benchmark zur Bewertung der Theory of Mind in LLMs durch explizite Modellierung von Überzeugungsstrukturen. Er überwindet die Grenzen der reinen Endpunkt-Fragebeantwortung und ermöglicht eine tiefere Analyse mentaler Zustandsrepräsentationen, einschließlich abweichender oder fehlerhafter Überzeugungen.
Original lesen ↗