heapsort
RESEARCH27

The Cognitive Categorical Transformer: Category-Theoretic Inductive Biases for Language Modeling

arXiv CS.AI·29 de mayo de 2026

El Cognitive Categorical Transformer (CCT) es una arquitectura de 306M parámetros que aumenta un GPT-2 Small preentrenado con componentes derivados de la teoría de categorías e inspiraciones de la ciencia cognitiva. Logró una reducción relativa del 12% en la perplejidad en WikiText-103 en comparación con un GPT-2 Small de referencia, atribuyéndose el 84% de la mejora al paso de mensajes simplistas de GT-Full.

Leer original