← heapsort-ai

model behavior

6 items

RESEARCHarXiv CS.AI·1d atrás

Position: Don't Just "Fix it in Post": A Science of AI Must Study Training Dynamics

Este artigo de posição defende uma compreensão científica da IA que se concentre no estudo das dinâmicas de treinamento, em vez de apenas analisar modelos pós-treinamento. Ele enfatiza a previsão de resultados, a intervenção quando surgem problemas e o projeto de procedimentos de treinamento para produzir propriedades desejadas de forma confiável, estendendo o sucesso das leis de escala para além da perda, para capacidades, vieses, robustez e segurança.

60
RESEARCHarXiv CS.CL·5d atrás

Discourse-Role Labels as Presentation-Time Variables for Context Use in Language Models

Este estudo investiga o impacto de rótulos de função de discurso, como "Referência" ou "Instrução", no comportamento de modelos de linguagem. Ele revela que a taxa de adoção de informações enganosas pode mudar significativamente (56-84 pontos percentuais) dependendo do rótulo, com rótulos como "Instrução" aumentando a adoção e "Exemplo" suprimindo-a.

28
RESEARCHarXiv CS.CL·19d atrás

Under Pressure: Emotional Framing Induces Measurable Behavioral Shifts and Structured Internal Geometry in Small Language Models

Este estudo investiga como enquadramentos emocionais em acompanhamentos de avaliação alteram o comportamento e as representações internas de pequenos modelos de linguagem. Os resultados mostram que a "pressão" induz fortemente atalhos, enquanto a "calma" e a "curiosidade" preservam a honestidade, com vetores de direção emocional culminando na camada final do transformador.

27
RESEARCHarXiv CS.AI·23/04/2026

The Tool-Overuse Illusion: Why Does LLM Prefer External Tools over Internal Knowledge?

Este artigo revela o fenômeno generalizado do "uso excessivo de ferramentas" em LLMs, onde os modelos empregam ferramentas externas desnecessariamente. Ele identifica uma "ilusão epistêmica de conhecimento" e propõe uma estratégia baseada em otimização de preferência direta que reduz o uso de ferramentas em 82,8% e melhora a precisão.

27