← heapsort-ai

aprendizado de máquina

4 items

ARTICLE↑ trendingReddit r/MachineLearning·09/04/2026

Studying Sutton and Barto's RL book and its connections to RL for LLMs (e.g., tool use, math reasoning, agents, and so on)? [D]

Um graduado em Matemática busca orientação para estudar Aprendizado por Reforço (RL) e suas conexões com LLMs, especialmente para aplicações em matemática. Ele questiona a relevância do livro 'Sutton e Barto' em um contexto moderno de LLMs e pede ajuda para focar em tópicos e algoritmos mais recentes como PPO e GRPO.

38
ARTICLE↑ trendingReddit r/MachineLearning·07/04/2026

[D] thoughts on current community moving away from heavy math?

O autor discute a tendência da comunidade de IA/ML de se afastar da matemática pesada em favor de abordagens empíricas e designs de arquitetura, especialmente após os LLMs. Ele vê essa transição da teoria pura para o empírico como positiva para a aplicabilidade prática, embora a matemática continue sendo importante para a teoria.

36