Qwen2.5

5 items

RESEARCH↑ trendingReddit r/MachineLearning·15/4/2026

Trained a Qwen2.5-0.5B-Instruct bf16 model on Reddit post summarization task with GRPO written from scratch in PyTorch - updates! [P]

El autor logró un éxito inicial entrenando un modelo Qwen2.5-0.5B-Instruct para la sumarización de publicaciones de Reddit utilizando GRPO, obteniendo una longitud de despliegue promedio de 64 tokens con recompensas de calidad y penalización de longitud. El experimento, ejecutado en un clúster de Mac Minis, emplea un "LLM-as-a-Judge" (GPT-5) para la evaluación y planea futuras iteraciones con funciones de recompensa ajustadas.

reinforcement learning Qwen2.5 GRPO Reddit

Trained a Qwen2.5-0.5B-Instruct bf16 model on Reddit post summarization task with GRPO written from scratch in PyTorch - updates! [P]

DOCDEV.to AI·25/4/2026

Tian AI Thinker: Building a Three-Layer LLM Reasoning Engine

El Tian AI Thinker es el núcleo cognitivo de Tian AI, orquestando un modelo Qwen2.5-1.5B local a través de un ThinkerRouter. Este enrutador envía las consultas a tres modos de razonamiento distintos (Fast, CoT y Deep), optimizados para diferentes tipos de consulta.

AI architecture Qwen2.5 Reasoning LLM

ARTICLEDEV.to AI·25/4/2026

Tian AI: The Self-Evolving AI System Powered by Qwen2.5

Tian AI es un sistema de IA de propósito general, autoevolutivo y de código abierto, impulsado por Qwen2.5-1.5B, que puede funcionar completamente offline en hardware de consumo. Combina múltiples motores especializados para aprender, evolucionar y mejorar su propio código con el tiempo.

Self-evolving AI AI system open-source AI Qwen2.5

ARTICLEDEV.to AI·27/4/2026

Tian AI: The Self-Evolving AI System Powered by Qwen2.5

Tian AI es un sistema de IA de código abierto, autoevolutivo y de propósito general, impulsado por Qwen2.5-1.5B, diseñado para funcionar completamente offline en hardware de consumo. Combina múltiples motores especializados para aprender, evolucionar y mejorar su propio código con el tiempo.

Self-evolving AI general-purpose AI open-source AI Qwen2.5

DOCDEV.to AI·9/5/2026

How to Deploy Qwen2.5 72B with vLLM + FastAPI on a $20/Month DigitalOcean GPU Droplet: Production Inference at 1/90th Claude Cost

Este artículo detalla cómo implementar el modelo Qwen2.5 72B en un droplet de GPU de DigitalOcean por solo $20 al mes. Ofrece una alternativa de bajo costo a las APIs comerciales de LLM, prometiendo inferencia de producción con un rendimiento competitivo al de Claude 3.5 Sonnet y una reducción de costos del 98%.

learning Qwen2.5 Cost Optimization LLM deployment