← heapsort-ai

self-supervised learning

10 items

RESEARCH↑ trendingReddit r/MachineLearning·17/4/2026

Low accuracy (~50%) with SSL (BYOL/MAE/VICReg) on hyperspectral crop stress data — what am I missing? [R]

El contenido detalla un problema persistente de baja precisión (~50%) al usar métodos de aprendizaje auto-supervisado como BYOL, MAE y VICReg para la detección de estrés en cultivos hiperespectrales. A pesar de probar varias técnicas, el rendimiento apenas supera el aleatorio para tres clases, lo que genera sospechas sobre la separabilidad de los datos o la idoneidad de los métodos SSL.

42
RESEARCHDEV.to AI·hace 3d

Self-Supervised Temporal Pattern Mining for bio-inspired soft robotics maintenance with zero-trust governance guarantees

El artículo explora el mantenimiento de la robótica blanda bioinspirada, abordando la naturaleza no lineal de la degradación de los materiales que desafía los programas de mantenimiento tradicionales. La investigación se centra en la Minería de Patrones Temporales Auto-Supervisada para identificar señales precursoras de fallas e integrar garantías de gobernanza de confianza cero.

31
RESEARCHarXiv CS.CL·hace 4d

Predict and Reconstruct: Joint Objectives for Self-Supervised Language Representation Learning

Este artículo presenta un objetivo de pre-entrenamiento híbrido para codificadores de texto, que combina una pérdida de predicción de espacio latente al estilo JEPA con un objetivo estándar de modelado de lenguaje enmascarado (MLM). Este nuevo enfoque busca fomentar representaciones ancladas en estructuras semánticas más profundas en lugar de solo la identidad superficial de los tokens, mostrando incrustaciones significativamente más uniformes.

30
ARTICLEDEV.to AI·hace 23d

Self-Supervised Temporal Pattern Mining for planetary geology survey missions under multi-jurisdictional compliance

Este artículo explora la minería de patrones temporales auto-supervisados para datos de levantamientos de geología planetaria, abordando las complejidades de la conformidad multi-jurisdiccional. Relata un descubrimiento personal en el análisis autónomo de imágenes satelitales y telemetría de rovers para misiones espaciales.

27
RESEARCHarXiv CS.CL·10/4/2026

Lexical Tone is Hard to Quantize: Probing Discrete Speech Units in Mandarin and Yor\`ub\'a

O artigo investiga como as unidades discretas de fala (DSUs), derivadas de modelos SSL, codificam o tom lexical, descobrindo que elas o fazem de forma menos confiável do que a estrutura segmental. Embora as representações latentes do SSL codifiquem o tom, a quantização tende a priorizar a estrutura fonética, um problema demonstrado em mandarim e iorubá que persiste com vários métodos.

27
RESEARCHarXiv CS.AI·hace 27d

RankQ: Offline-to-Online Reinforcement Learning via Self-Supervised Action Ranking

RankQ es un objetivo de aprendizaje por refuerzo offline-a-online que mejora la eficiencia de la muestra utilizando conjuntos de datos pre-recopilados. Aborda el desafío de aprender un crítico preciso en grandes espacios de estado-acción mediante una pérdida de clasificación multi-término auto-supervisada, que impone un orden estructurado de las acciones y dirige la función Q hacia acciones de mayor calidad.

27
RESEARCHarXiv CS.LG·8/4/2026

PRIME: Prototype-Driven Multimodal Pretraining for Cancer Prognosis with Missing Modalities

PRIME é um novo framework de pré-treinamento multimodal auto-supervisionado projetado para prognóstico de câncer, que aborda o desafio de modalidades de dados ausentes em coortes clínicas. Ele integra imagens de histopatologia, expressão gênica e relatórios patológicos, aprendendo representações robustas por meio de imputação semântica no espaço latente e objetivos de alinhamento intermodal.

27
RESEARCHarXiv CS.LG·6/4/2026

UI-Oceanus: Scaling GUI Agents with Synthetic Environmental Dynamics

UI-Oceanus é uma estrutura que escala agentes GUI generalistas, focando em dominar a física da interação através de feedback ambiental em vez de imitar trajetórias. O sistema utiliza exploração autônoma e predição de dinâmicas futuras para construir um modelo de mundo interno robusto, superando limitações de dados e supervisão.

27