RESEARCH46

TinyJudge: Unverifiable Constraint Alignment via Lightweight Specialist Ensembles

arXiv CS.CL·9 de junho de 2026

O artigo apresenta o TinyJudge, uma estrutura que emprega um conjunto de pequenos modelos de linguagem especializados (0.6B) para fornecer recompensas leves e de alta precisão para restrições suaves e não verificáveis no seguimento de instruções por LLMs. Esta abordagem visa superar gargalos como a manipulação de recompensas e o alto custo computacional em métodos tradicionais de alinhamento de restrições.

Tiny Models Model Alignment LLMs reinforcement learning Constraint Alignment

Ler original ↗