ARTICLE↑ trending55

Why do only big ML labs dominate widely-used models despite many open-source pretrained models smaller labs could do RL on? [D]

Reddit r/MachineLearning·26 de abril de 2026

O conteúdo questiona por que grandes laboratórios de IA dominam os modelos mais usados, como GPT e Claude, apesar da existência de muitos modelos pré-treinados de código aberto em escala semelhante. O autor sugere que o Reinforcement Learning from Human Feedback (RLHF) é a chave para a superioridade desses modelos e pergunta por que isso não seria mais acessível para laboratórios menores.

open-source AIRLHFAI industrylarge language modelsAI development

Ler original ↗