ARTICLE↑ trending42

Why do only big ML labs dominate widely-used models despite many open-source pretrained models smaller labs could do RL on? [D]

Reddit r/MachineLearning·26. April 2026

Der Inhalt hinterfragt, warum große KI-Labore weit verbreitete Modelle wie GPT und Claude dominieren, obwohl viele Open-Source-Modelle ähnlichen Umfangs vorab trainiert wurden. Der Autor vermutet, dass Reinforcement Learning from Human Feedback (RLHF) der Schlüssel zur Überlegenheit dieser Modelle ist und fragt, warum dies für kleinere Labore nicht zugänglicher sein sollte.

open-source AI RLHF AI industry large language models AI development

Original lesen ↗