multi-task reasoning

2 items

ARTICLE↑ trendingReddit r/MachineLearning·26/04/2026

Going from 3B/7B dense to Nemotron 3 Nano (hybrid Mamba-MoE) for multi-task reasoning — what changes in the fine-tuning playbook? [D]

L'auteur passe du réglage fin de transformateurs denses au Nemotron 3 Nano de NVIDIA (une architecture hybride Mamba-Attention-MoE) pour le raisonnement multi-tâches. Il cherche des conseils sur la manière dont l'architecture hybride impacte la recette standard de réglage fin LoRA, son expérience antérieure étant limitée aux modèles denses.

LLMs multi-task reasoning AI Architectures Fine-tuning

ARTICLE↑ trendingReddit r/MachineLearning·23/04/2026

First time fine-tuning, need a sanity check — 3B or 7B for multi-task reasoning? [D]

Un utilisateur autodidacte, débutant en fine-tuning, demande conseil pour choisir entre des modèles LLM 3B et 7B pour un projet de raisonnement multi-tâches. Le projet vise à comprendre l'intention sous-jacente des questions, à maintenir plusieurs perspectives et à gérer des entrées complexes.

LLMs model selection multi-task reasoning NLP