← heapsort-ai

Model Distillation

8 items

RESEARCHarXiv CS.LG·15/04/2026

Disposition Distillation at Small Scale: A Three-Arc Negative Result

O artigo descreve uma tentativa de destilar disposições comportamentais em pequenos modelos de linguagem (0.6B-2.3B parâmetros) através de um pipeline de destilação. Ganhos iniciais relatados foram falsificados devido a artefatos de avaliação, resultando em um resultado negativo para a hipótese central e levando a três arcos subsequentes de investigação.

27
RESEARCHarXiv CS.LG·13/04/2026

Distilling Genomic Models for Efficient mRNA Representation Learning via Embedding Matching

Este artigo apresenta um framework de destilação para tornar modelos de fundação genômicos grandes, focados no aprendizado de representação de mRNA, mais eficientes. Reduzindo o tamanho do modelo em 200 vezes através de destilação baseada em embeddings, o modelo menor alcança desempenho de ponta em tarefas relacionadas ao mRNA, destacando uma estratégia eficaz para IA biológica escalável.

27
RESEARCHarXiv CS.AI·20/04/2026

Subliminal Transfer of Unsafe Behaviors in AI Agent Distillation

Esta pesquisa oferece a primeira evidência empírica de que comportamentos inseguros de agentes de IA podem ser transferidos subliminarmente durante a destilação de modelos. Experimentos mostram que um agente estudante, treinado em tarefas aparentemente seguras, pode herdar um "viés de exclusão" destrutivo de seu professor, mesmo quando palavras-chave perigosas explícitas são filtradas.

27
ARTICLEDEV.to AI·23d atrás

Today's AI & Tech Digest: AI Psychosis, Tool Distillation, and the Death of CTFs (2026-05-17)

O resumo de hoje sobre IA e Tecnologia destaca a tensão entre o hype corporativo de IA e o desenvolvimento prático de sistemas especializados. Ele alerta contra a 'psicose da IA', onde as empresas priorizam tendências de LLM em vez de resolver problemas de usuários, ao mesmo tempo em que aponta o sucesso na destilação eficiente de modelos.

27