ARTICLE↑ trending42

Why do only big ML labs dominate widely-used models despite many open-source pretrained models smaller labs could do RL on? [D]

Reddit r/MachineLearning·26 de abril de 2026

El contenido cuestiona por qué los grandes laboratorios de IA dominan los modelos más utilizados, como GPT y Claude, a pesar de la existencia de muchos modelos preentrenados de código abierto de escala similar. El autor sugiere que el aprendizaje por refuerzo a partir de la retroalimentación humana (RLHF) es clave para la superioridad de estos modelos y se pregunta por qué no sería más accesible para laboratorios más pequeños.

open-source AI RLHF AI industry large language models AI development

Leer original ↗