multi-task reasoning

2 items

ARTICLE↑ trendingReddit r/MachineLearning·26/4/2026

Going from 3B/7B dense to Nemotron 3 Nano (hybrid Mamba-MoE) for multi-task reasoning — what changes in the fine-tuning playbook? [D]

El autor está pasando del ajuste fino de transformadores densos al Nemotron 3 Nano de NVIDIA (una arquitectura híbrida Mamba-Attention-MoE) para el razonamiento multi-tarea. Busca orientación sobre cómo la arquitectura híbrida afecta la receta estándar de ajuste fino LoRA, ya que su experiencia previa se limita a modelos densos.

LLMs multi-task reasoning AI Architectures Fine-tuning

ARTICLE↑ trendingReddit r/MachineLearning·23/4/2026

First time fine-tuning, need a sanity check — 3B or 7B for multi-task reasoning? [D]

Un usuario autodidacta, principiante en el fine-tuning, pide consejo sobre la elección entre modelos LLM de 3B y 7B para un proyecto de razonamiento multitarea. El proyecto implica entender la intención subyacente en las preguntas, mantener múltiples perspectivas y manejar entradas desordenadas.

LLMs model selection multi-task reasoning NLP