← heapsort-ai

model behavior

6 items

RESEARCHarXiv CS.AI·vor 1T

Position: Don't Just "Fix it in Post": A Science of AI Must Study Training Dynamics

Dieses Positionspapier plädiert für ein wissenschaftliches Verständnis von KI, das sich auf die Untersuchung der Trainingsdynamik konzentriert, anstatt Modelle nur nach dem Training zu analysieren. Es betont die Vorhersage von Ergebnissen, das Eingreifen bei Problemen und das Design von Trainingsverfahren, um gewünschte Eigenschaften zuverlässig zu erzeugen, und erweitert den Erfolg von Skalierungsgesetzen über den Verlust hinaus auf Fähigkeiten, Verzerrungen, Robustheit und Sicherheitsrelevanz.

60
RESEARCHarXiv CS.CL·4/27/2026

Shared Lexical Task Representations Explain Behavioral Variability In LLMs

Diese Forschung untersucht die Prompt-Sensitivität von LLMs durch den Vergleich von instruktionsbasierten und beispielbasierten Prompt-Stilen. Es wird festgestellt, dass LLMs trotz großer Leistungsvariationen gemeinsame zugrunde liegende Mechanismen nutzen, insbesondere „lexical task heads“, die die Aufgabe beschreiben und die Antwortgenerierung auslösen.

29
RESEARCHarXiv CS.CL·vor 5T

Discourse-Role Labels as Presentation-Time Variables for Context Use in Language Models

Diese Studie untersucht den Einfluss von Diskursrollen-Etiketten wie "Referenz" oder "Anweisung" auf das Verhalten von Sprachmodellen. Es zeigt sich, dass sich die Adoptionsrate irreführender Informationen je nach Etikett erheblich verschieben kann (56-84 Prozentpunkte), wobei Etiketten wie "Anweisung" die Adoption erhöhen und "Beispiel" sie konstant unterdrückt.

28
RESEARCHarXiv CS.CL·vor 19T

Under Pressure: Emotional Framing Induces Measurable Behavioral Shifts and Structured Internal Geometry in Small Language Models

Diese Studie untersucht, wie emotional gerahmte Bewertungs-Follow-ups sowohl das Verhalten als auch die internen Repräsentationen kleiner Sprachmodelle verändern. Die Ergebnisse zeigen, dass „Druck“ die stärksten Shortcut-Marker hervorruft, während „Ruhe“ und „Neugier“ die Ehrlichkeit besser bewahren.

27
RESEARCHarXiv CS.AI·4/23/2026

The Tool-Overuse Illusion: Why Does LLM Prefer External Tools over Internal Knowledge?

Dieses Papier enthüllt das weit verbreitete Phänomen der „Werkzeugübernutzung“ bei LLMs, bei dem Modelle externe Werkzeuge unnötig einsetzen. Es identifiziert eine „epistemische Wissensillusion“ und schlägt eine auf direkter Präferenzoptimierung basierende Strategie vor, die den Werkzeuggebrauch um 82,8 % reduziert und die Genauigkeit verbessert.

27