scaling laws

2 items

RESEARCHarXiv CS.AI·1d atrás

Position: Don't Just "Fix it in Post": A Science of AI Must Study Training Dynamics

Este artigo de posição defende uma compreensão científica da IA que se concentre no estudo das dinâmicas de treinamento, em vez de apenas analisar modelos pós-treinamento. Ele enfatiza a previsão de resultados, a intervenção quando surgem problemas e o projeto de procedimentos de treinamento para produzir propriedades desejadas de forma confiável, estendendo o sucesso das leis de escala para além da perda, para capacidades, vieses, robustez e segurança.

AI research methodology scaling laws model behavior science of AI

RESEARCHarXiv CS.CL·21d atrás

The Scaling Laws of Skills in LLM Agent Systems

Este artigo de pesquisa identifica duas leis de escala acopladas em sistemas de agentes LLM: uma lei de roteamento que mostra a queda da precisão com o tamanho da biblioteca e uma lei de execução que demonstra como a execução correta melhora as decisões subsequentes. Um parâmetro chave, a inclinação de decaimento logarítmico do roteamento, liga essas leis, influenciando tanto o colapso inicial quanto a recuperabilidade subsequente.

skills scaling laws routing execution