model behavior

6 items

RESEARCHarXiv CS.AI·1d atrás

Position: Don't Just "Fix it in Post": A Science of AI Must Study Training Dynamics

Este artigo de posição defende uma compreensão científica da IA que se concentre no estudo das dinâmicas de treinamento, em vez de apenas analisar modelos pós-treinamento. Ele enfatiza a previsão de resultados, a intervenção quando surgem problemas e o projeto de procedimentos de treinamento para produzir propriedades desejadas de forma confiável, estendendo o sucesso das leis de escala para além da perda, para capacidades, vieses, robustez e segurança.

AI research methodology scaling laws model behavior science of AI

ARTICLE↑ trendingReddit r/LocalLLaMA·23/04/2026

POV Qwen 3.5 with thinking

Este conteúdo aborda o comportamento do modelo de IA Qwen 3.5, que frequentemente fica preso em ciclos de pensamento. O autor faz uma observação breve e informal sobre essa característica do modelo.

thinking loops model behavior AI Model Qwen

RESEARCHarXiv CS.CL·27/04/2026

Shared Lexical Task Representations Explain Behavioral Variability In LLMs

Esta pesquisa investiga a sensibilidade de prompts em LLMs, comparando estilos baseados em instruções e exemplos. Descobre-se que, apesar da variação no desempenho, os LLMs compartilham mecanismos subjacentes comuns, como "lexical task heads" que descrevem a tarefa e disparam a produção de respostas.

model interpretability LLMs prompt-engineering attention mechanisms

RESEARCHarXiv CS.CL·5d atrás

Discourse-Role Labels as Presentation-Time Variables for Context Use in Language Models

Este estudo investiga o impacto de rótulos de função de discurso, como "Referência" ou "Instrução", no comportamento de modelos de linguagem. Ele revela que a taxa de adoção de informações enganosas pode mudar significativamente (56-84 pontos percentuais) dependendo do rótulo, com rótulos como "Instrução" aumentando a adoção e "Exemplo" suprimindo-a.

language models Context NLP model behavior

RESEARCHarXiv CS.CL·19d atrás

Under Pressure: Emotional Framing Induces Measurable Behavioral Shifts and Structured Internal Geometry in Small Language Models

Este estudo investiga como enquadramentos emocionais em acompanhamentos de avaliação alteram o comportamento e as representações internas de pequenos modelos de linguagem. Os resultados mostram que a "pressão" induz fortemente atalhos, enquanto a "calma" e a "curiosidade" preservam a honestidade, com vetores de direção emocional culminando na camada final do transformador.

NLP model behavior emotional framing AI Research

RESEARCHarXiv CS.AI·23/04/2026

The Tool-Overuse Illusion: Why Does LLM Prefer External Tools over Internal Knowledge?

Este artigo revela o fenômeno generalizado do "uso excessivo de ferramentas" em LLMs, onde os modelos empregam ferramentas externas desnecessariamente. Ele identifica uma "ilusão epistêmica de conhecimento" e propõe uma estratégia baseada em otimização de preferência direta que reduz o uso de ferramentas em 82,8% e melhora a precisão.

LLMs Knowledge Representation Reasoning model behavior