← heapsort-ai

Weak Supervision

3 items

RESEARCHarXiv CS.AI·4/9/2026

Weakly Supervised Distillation of Hallucination Signals into Transformer Representations

Este artigo propõe um novo método para detecção de alucinações em LLMs, destilando sinais de supervisão externa diretamente nas representações internas do modelo durante o treinamento. Para isso, introduz um framework de supervisão fraca que combina correspondência de substrings, similaridade de embeddings e um LLM como juiz, culminando na criação de um dataset de 15.000 amostras para este propósito.

28
RESEARCHarXiv CS.LG·4/13/2026

Structured Exploration and Exploitation of Label Functions for Automated Data Annotation

Dieses Paper stellt EXPONA vor, ein automatisiertes Framework für programmatisches Labeling, das die Herausforderungen kostspieliger und fehleranfälliger manueller Datenannotation angeht. EXPONA untersucht systematisch mehrstufige Label-Funktionen und wendet zuverlässigkeitsbewusste Mechanismen an, um hochwertige schwache Labels für das Training von KI-Modellen zu generieren.

27
RESEARCHarXiv CS.LG·4/8/2026

Learning Stable Predictors from Weak Supervision under Distribution Shift

Este artigo de pesquisa formaliza o 'supervision drift' em experimentos CRISPR-Cas13d, analisando a robustez de modelos sob shift de distribuição, inclusive quando o mecanismo de supervisão muda. Utilizando um benchmark não-IID, demonstra bom desempenho in-domain, mas falha na transferência temporal e apenas sucesso parcial na transferência entre linhagens celulares.

27