← heapsort-ai

cognitive science

21 items

RESEARCHarXiv CS.AI·vor 20Std

Some hypotheses on how chatbots work in problem-solving-driven conversations. Large Language Models as confirmation of the Innovation Illusion

Dieser Artikel untersucht die Natur von Chatbots, insbesondere Large Language Models, als Gesprächspartner bei der Problemlösung, basierend auf Kognitiver Linguistik und Neuropsychologie. Er hypothesiert, dass die Trainingsdatensätze von LLMs das menschliche Denken und Verstehen nur teilweise nachahmen und künstliche metaphorische Problempropagationen kodieren.

54
ARTICLEDEV.to AI·vor 15T

ความหมายของ 'ความหมาย': เมื่อ AI ค้นหาเส้นแบ่งระหว่างการจดจำกับภาพลวง

Dieser Artikel untersucht, wie KI 'Bedeutung versteht' im Vergleich zu Menschen, aus der Perspektive der Neurowissenschaften, KI-Ethik und eingeschränkter Kreativität. Die zentrale philosophische und technische Frage ist, ob KI 'Bedeutung wirklich versteht' oder lediglich eine Illusion von Kontinuität erzeugt, im Gegensatz zum menschlichen Gedächtnis, das ständige Auswahl und Interpretation beinhaltet.

29
RESEARCHarXiv CS.CL·vor 22T

Neural Activation Patterns Across Language Model Architectures: A Comprehensive Analysis of Cognitive Task Performance

Dieses Papier präsentiert eine umfassende Analyse neuronaler Aktivierungsmuster in sechs verschiedenen Architekturen großer Sprachmodelle (LLM), wobei deren Leistung bei zwölf kognitiven Aufgabenkategorien untersucht wird. Die Ergebnisse offenbaren grundlegende Unterschiede in der Verarbeitung vielfältiger kognitiver Aufgaben durch Encoder- und Decoder-Architekturen, wobei mathematisches Denken die höchste Aufmerksamkeitsentropie erzeugt und Decoder-Modelle signifikant höhere Sparsity aufweisen.

29
ARTICLEDEV.to AI·vor 15T

The Meaning of 'Meaning': When AI Seeks the Line Between Recognition and Illusion

Dieser Artikel untersucht, wie KI „Bedeutung verstehen“ könnte im Vergleich zu Menschen, indem er die Frage durch die Brille der Neurowissenschaften, KI-Ethik und eingeschränkten Kreativität betrachtet. Er kommt zu dem Schluss, dass KI Bedeutung nicht wie Menschen erfassen kann, da ihr verkörperte und kulturelle Erfahrungen fehlen.

28
RESEARCHarXiv CS.CL·5/4/2026

Timing is Everything: Temporal Scaffolding of Semantic Surprise in Humor

Diese Forschung schlägt den Dual Prediction Violation (DPV)-Rahmen vor, um Humor zu erklären, wobei die Wechselwirkung zwischen Inhalt und Timing betont wird. Durch die Analyse von 828 chinesischen Stand-up-Darbietungen zeigt sie, dass zeitliche Merkmale, insbesondere Spitzen semantischer Verletzungen und systematische Pausen, die Publikumsreaktion wesentlich stärker vorhersagen als alleinige semantische Inkongruenz.

28
RESEARCHarXiv CS.CL·vor 22T

Greedy or not, here I come: Language production under vocabulary constraints in humans and resource-rational models

Diese Forschung untersucht, wie Menschen mit begrenztem Wortschatz kommunizieren, und vergleicht ihre Strategien mit computationalen Stichprobenalgorithmen, die von großen Sprachmodellen angetrieben werden. Die Studie zeigt, dass die menschliche Sprachproduktion unter Einschränkungen oft dem Greedy-Sampling ähnelt, obwohl erfahrenere Personen nicht-greedy Revisionsverhalten zeigen.

28
RESEARCHarXiv CS.CL·4/22/2026

Probing for Reading Times

Diese Forschung untersucht Sprachmodellrepräsentationen auf menschliche Lesezeiten in fünf Sprachen und vergleicht sie mit skalaren Prädiktoren. Es zeigt sich, dass frühe Schichten der Sprachmodelle die Überraschung bei der Vorhersage von Frühpass-Lesemaßen übertreffen, was eine funktionale Ausrichtung zwischen Modelltiefe und den zeitlichen Stadien des menschlichen Lesens nahelegt.

27
RESEARCHarXiv CS.CL·vor 22T

Why are language models less surprised than humans? Testing the Parse Multiplicity Mismatch Hypothesis

Diese Arbeit untersucht, warum Sprachmodelle bei syntaktisch mehrdeutigen Sätzen weniger „überrascht“ sind als Menschen. Sie testet die Hypothese, dass Sprachmodelle gleichzeitig eine größere Anzahl von Satzinterpretationen berücksichtigen können, indem sie rekurrente neuronale Netzgrammatiken verwenden.

27
RESEARCHDEV.to AI·4/25/2026

Deep Dive: The Cognitive Science Behind the ACLAS Neuro-Edu SDK 🏛️🧠

Der Inhalt stellt das ACLAS Neuro-Edu SDK vor, das darauf abzielt, die Ausrichtung von LLMs an den menschlichen Geist durch die Integration kognitionswissenschaftlicher Prinzipien neu zu konzipieren. Es beschreibt einen multifaktoriellen intrinsischen Belastungsschätzer, um eine Überforderung der Lernenden zu verhindern, der lexikalische Komplexität und konzeptuelle Dichte berücksichtigt.

27
RESEARCHarXiv CS.CL·5/1/2026

Semantic Structure of Feature Space in Large Language Models

Diese Studie zeigt, dass die geometrischen Beziehungen zwischen semantischen Merkmalen in den verborgenen Zuständen großer Sprachmodelle menschliche psychologische Assoziationen widerspiegeln. Es wird demonstriert, dass Wortvektorprojektionen auf semantische Achsen mit menschlichen Bewertungen korrelieren und die Ähnlichkeit zwischen diesen Achsen die Zusammenhänge von semantischen Skalen vorhersagt.

27
RESEARCHarXiv CS.AI·vor 17T

Investigating Concept Alignment Using Implausible Category Members

Diese Forschung untersucht das Verständnis alltäglicher Konzepte durch KI-Systeme, indem sie deren Zuordnung von Objekten zu plausiblen und unplausiblen Kategorien analysiert. Ziel ist es, Konzeptgrenzen zu charakterisieren, indem die Zuordnungen von KI-Systemen mit denen menschlicher Teilnehmer aus einer klassischen psychologischen Studie verglichen werden.

27
RESEARCHarXiv CS.AI·vor 11T

The Cognitive Categorical Transformer: Category-Theoretic Inductive Biases for Language Modeling

Der Cognitive Categorical Transformer (CCT) ist eine 306M-Parameter-Architektur, die einen vortrainierten GPT-2 Small Backbone mit kognitiv fundierten Komponenten aus der Kategorientheorie und Inspirationen aus der Kognitionswissenschaft erweitert. Er erreichte eine relative Reduktion der Perplexität um 12 % auf WikiText-103 im Vergleich zu einer identisch feingetunten GPT-2 Small Baseline, wobei 84 % der Verbesserung dem GT-Full-Simplizial-Nachrichten-Passing zugeschrieben werden.

27
RESEARCHarXiv CS.AI·vor 13T

Can LLMs Introspect? A Reality Check

Eine neue Studie hinterfragt, ob große Sprachmodelle (LLMs) wirklich introspektionsfähig sind, und argumentiert, dass aktuelle Schlussfolgerungen verfrüht sein könnten. Sie legt nahe, dass der scheinbare Erfolg eher auf allgemeiner Anomalieerkennung als auf echter Introspektion beruhen könnte, basierend auf Erkenntnissen aus der menschlichen Metakognitionsforschung.

27