ARTICLE↑ trending55
Why do only big ML labs dominate widely-used models despite many open-source pretrained models smaller labs could do RL on? [D]
Reddit r/MachineLearning·26 de abril de 2026
O conteúdo questiona por que grandes laboratórios de IA dominam os modelos mais usados, como GPT e Claude, apesar da existência de muitos modelos pré-treinados de código aberto em escala semelhante. O autor sugere que o Reinforcement Learning from Human Feedback (RLHF) é a chave para a superioridade desses modelos e pergunta por que isso não seria mais acessível para laboratórios menores.
open-source AIRLHFAI industrylarge language modelsAI development
Ler original ↗