← heapsort-ai

Machine Learning Theory

4 items

RESEARCHarXiv CS.LG·5d atrás

Pseudospectral Bounds for Transient Amplification in Coupled Gradient Descent

O artigo desenvolve uma teoria pseudosspectral precisa para sistemas de gradiente descendente acoplado com jacobianos bloco-triangulares, relevantes para otimização de dois níveis e treinamento adversarial. Ele estabelece limites para a amplificação transiente e caracteriza os limiares críticos de acoplamento para instabilidade espectral.

31
RESEARCHarXiv CS.AI·28d atrás

On Distinguishing Capability Elicitation from Capability Creation in Post-Training: A Free-Energy Perspective

Esta pesquisa propõe distinguir entre a elicitação e a criação de capacidades no pós-treinamento de grandes modelos de linguagem. Argumenta que a elicitação repondera comportamentos existentes dentro do suporte acessível de um modelo, enquanto a criação altera esse suporte, desenvolvendo isso através de uma perspectiva de energia livre.

27