Training

20 items

RESEARCHarXiv CS.CL·hace 19h

Post-training is (Massive) Supervised Learning

Este artículo sostiene que el paradigma predominante de post-entrenamiento para LLMs, que incluye SFT y RL, revierte efectivamente al enfoque de "pre-entrenar y luego ajustar", adaptando los modelos explícitamente a benchmarks específicos. La evidencia empírica demuestra que los modelos post-entrenados desde cero pueden ofrecer un rendimiento significativo en conjuntos de datos de razonamiento.

LLMs machine learning Benchmarking Training

ARTICLE↑ trendingReddit r/LocalLLaMA·15/4/2026

Video of how my LLM's decoder blocks changed while training

Este contenido presenta un vídeo que muestra cómo cambiaron los bloques del decodificador de un LLM durante el entrenamiento, como continuación de una publicación popular anterior. El autor comparte datos visuales para ilustrar el proceso de evolución del modelo.

neural networks deep learning Training decoder blocks

Video of how my LLM's decoder blocks changed while training

DOCDEV.to AI·23/4/2026

Redes Neuronales Convolucionales - Clasificacione de imagenes Landmarks

Este video explica el proceso para entrenar un modelo de red neuronal usando Redes Neuronales Convolucionales (CNN) para la clasificación de imágenes de hitos. Los interesados pueden probar o seguir el pipeline de entrenamiento disponible en el Github del autor.

neural networks deep learning image classification Convolutional Neural Networks

DOCDEV.to AI·hace 2d

Pytorch for Neural Networks Part 7: Training with Loss and Derivatives

Este artículo, parte de una serie de PyTorch, detalla el proceso de entrenamiento de redes neuronales demostrando una estructura de bucle anidado para iterar a través de los datos de entrenamiento. Explica cómo calcular la pérdida total, derivar la salida y aplicar la función de pérdida para la optimización del modelo usando `loss.backward()`.

neural networks deep learning learning Training

NEWSDEV.to AI·22/4/2026

Google Launches AI Chips for Training and Inference

Google ha lanzado una nueva línea de chips de IA, denominados "Triton X", para desafiar el dominio de Nvidia, prometiendo una reducción del 40% en los costos de entrenamiento y una latencia de inferencia un 25% menor. Este lanzamiento marca un cambio sísmico en la industria del hardware de IA, intensificando la competencia.

inference AI hardware Training Google

ARTICLEDEV.to AI·11/4/2026

How Neural Networks Actually Learn: Backpropagation, Gradients, and Training Loop (Developer Guide)

Este artículo detalla el proceso de aprendizaje de las redes neuronales mediante optimización, cubriendo el ciclo de entrenamiento desde la propagación directa hasta la actualización de pesos. Explica la importancia de la retropropagación y las funciones de pérdida para calcular gradientes y ajustar los parámetros del modelo.

neural networks loss functions Training backpropagation

RESEARCHHugging Face Blog·9/3/2026

Ulysses Sequence Parallelism: Training with Million-Token Contexts

Este conteúdo aborda o paralelismo de sequência Ulysses, uma técnica inovadora para o treinamento de modelos de inteligência artificial. O foco está na capacitação de modelos para processar contextos de milhões de tokens de forma eficiente.

deep learning Long Contexts Training High-Performance Computing

DOCHugging Face (YouTube)·22/4/2026

RL for Agents Workshop - Deep Dive on Training Agents with RL and Open Source

Este taller ofrece una inmersión profunda en el entrenamiento de agentes de IA utilizando principios de Aprendizaje por Refuerzo (RL). Se centra específicamente en el aprovechamiento de herramientas y técnicas de código abierto para el desarrollo práctico de agentes.

Open Source reinforcement learning learning Training

RL for Agents Workshop - Deep Dive on Training Agents with RL and Open Source

ARTICLEQwen Blog·20/1/2025

Global-batch load balance almost free lunch to improve your MoE LLM training

O conteúdo introduz a arquitetura Mixture-of-Experts (MoE) como uma técnica popular para escalar parâmetros de modelos. Ele descreve a camada MoE consistindo de um roteador e um grupo de experts, onde apenas um subconjunto é ativado para processar uma entrada.

deep learning Training MoE Neural Architecture

ARTICLEDEV.to AI·27/4/2026

Agentic AI Course in Hyderabad | Agentic AI Online Training

Este contenido introduce la IA Agente, detallando sus principios como comprender objetivos y usar herramientas para desglosar tareas. Destaca características clave como autonomía y adaptabilidad, mostrando aplicaciones prácticas en áreas como soporte al cliente y análisis financiero.

hiring future-of-work Training Agentic AI

ARTICLEDEV.to AI·14/4/2026

ServiceNow Course | ServiceNow Training Online

Este contenido presenta un curso y una guía sobre ServiceNow AI, cubriendo roles, habilidades y perspectivas de carrera. Es ofrecido por un instituto de formación online en Hyderabad e incluye preguntas frecuentes.

ServiceNow Training AI

NEWSDEV.to AI·2/5/2026

National Cyber Security Institute (NCSI) - Global Cybersecurity Training

El National Cyber Security Institute (NCSI) ofrece cursos en línea acreditados internacionalmente para especializarse en Ciberseguridad, Inteligencia de Amenazas y Análisis de Malware. Los programas brindan acceso de por vida, actualizaciones gratuitas y soporte experto para avanzar en la carrera con certificaciones reconocidas por la industria.

cybersecurity security Training online learning

DOCDEV.to AI·hace 24d

Dynamics 365 Finance And Operations Training | D365 Online Training

Visualpath ofrece capacitación en tiempo real para consultores funcionales de D365 Finance & Operations en Hyderabad. Son un instituto de capacitación en línea líder que ofrece cursos enfocados en la industria con capacitadores expertos.

Finance and Operations learning Training Dynamics 365

ARTICLEDEV.to AI·8/4/2026

Best Snowflake Training in Hyderabad | Online & Offline Training

O conteúdo descreve as oportunidades de treinamento Snowflake em Hyderabad, tanto online quanto presencial, para aprimorar habilidades em análise e gerenciamento de dados. Os cursos cobrem desde a arquitetura do Snowflake e segurança até otimização de desempenho e análise avançada, preparando profissionais para carreiras como Engenheiro ou Analista de Dados.

Advanced Analytics data management Snowflake data engineering

DOCDEV.to AI·hace 22d

SAP SD Training: Live Classes + Placement Support 2026

Este contenido presenta la formación en SAP SD, destacando su alta demanda, salarios lucrativos y los beneficios de un curso online flexible. Detalla el plan de estudios completo del módulo de Ventas y Distribución de SAP y el apoyo para la colocación profesional.

SAP SD learning Training Career

ARTICLEDEV.to AI·hace 21d

Why “SEO Courses Near Me” Searches Are Growing Faster Than Ever

La demanda de cursos de SEO está creciendo rápidamente debido a la necesidad de visibilidad online, pero muchos programas de formación actuales están desactualizados o carecen de aplicación práctica. Esto impide que estudiantes y profesionales desarrollen las habilidades digitales necesarias para generar tráfico y conversiones en el mundo real.

learning digital-marketing Training Career

DOCDEV.to AI·28/4/2026

How to Manage Automotive Training Videos with Multi-Speed Playback?

Este contenido trata sobre cómo gestionar videos de capacitación automotriz. El enfoque principal es utilizar la funcionalidad de reproducción a varias velocidades.

video-management automotive Training

DOCDEV.to AI·hace 18d

D365 Finance And Operations Training | D365 Training

Visualpath, un instituto de formación en Hyderabad, ofrece cursos centrados en la industria para expertos en D365 Finance & Operations. El programa aborda las habilidades que las empresas esperan de los profesionales en este campo.

ERP learning Training D365

ARTICLEDEV.to AI·24/4/2026

Turn Creativity into Career with Best Digital Marketing in Trivandrum

Este artículo promueve el marketing digital como una carrera muy solicitada en la economía digital actual, destacando la importancia de una formación adecuada. Sugiere que elegir el mejor instituto de capacitación, como Edure en Trivandrum, es crucial para el éxito profesional.

education Career Development digital-marketing Training

DOCDEV.to AI·21/4/2026

D365 Online Training | D365 Finance And Operations Training

El contenido pregunta qué curso de Dynamics 365 Finance es el mejor para principiantes. La página asociada ofrece capacitación en línea para Dynamics 365 Finance and Operations.

Finance ERP Training Microsoft Dynamics 365