ARTICLE↑ trending42
Why do only big ML labs dominate widely-used models despite many open-source pretrained models smaller labs could do RL on? [D]
Reddit r/MachineLearning·26. April 2026
Der Inhalt hinterfragt, warum große KI-Labore weit verbreitete Modelle wie GPT und Claude dominieren, obwohl viele Open-Source-Modelle ähnlichen Umfangs vorab trainiert wurden. Der Autor vermutet, dass Reinforcement Learning from Human Feedback (RLHF) der Schlüssel zur Überlegenheit dieser Modelle ist und fragt, warum dies für kleinere Labore nicht zugänglicher sein sollte.
Original lesen ↗