Qwen2.5

5 items

RESEARCH↑ trendingReddit r/MachineLearning·15/04/2026

Trained a Qwen2.5-0.5B-Instruct bf16 model on Reddit post summarization task with GRPO written from scratch in PyTorch - updates! [P]

O autor obteve sucesso inicial no treinamento de um modelo Qwen2.5-0.5B-Instruct para sumarização de posts do Reddit usando GRPO, alcançando um comprimento médio de 64 tokens com recompensas de qualidade e penalidade de comprimento. O experimento, executado em um cluster de Mac Minis, utiliza um "LLM-as-a-Judge" (GPT-5) para avaliação e planeja futuras iterações com ajustes nas funções de recompensa.

reinforcement learning Qwen2.5 GRPO Reddit

Trained a Qwen2.5-0.5B-Instruct bf16 model on Reddit post summarization task with GRPO written from scratch in PyTorch - updates! [P]

DOCDEV.to AI·25/04/2026

Tian AI Thinker: Building a Three-Layer LLM Reasoning Engine

O Tian AI Thinker é o núcleo cognitivo do Tian AI, orquestrando um modelo Qwen2.5-1.5B local através de um ThinkerRouter. Este roteador direciona as consultas para três modos de raciocínio distintos (Fast, CoT e Deep), otimizados para diferentes tipos de solicitação.

AI architecture Qwen2.5 Reasoning LLM

ARTICLEDEV.to AI·25/04/2026

Tian AI: The Self-Evolving AI System Powered by Qwen2.5

Tian AI é um sistema de IA de propósito geral, auto-evolutivo e de código aberto, alimentado por Qwen2.5-1.5B, capaz de operar completamente offline em hardware de consumo. Ele integra vários motores especializados para aprender, evoluir e aprimorar seu próprio código ao longo do tempo.

Self-evolving AI AI system open-source AI Qwen2.5

ARTICLEDEV.to AI·27/04/2026

Tian AI: The Self-Evolving AI System Powered by Qwen2.5

Tian AI é um sistema de IA de código aberto, autoevolutivo e de propósito geral, alimentado por Qwen2.5-1.5B, projetado para operar offline em hardware de consumidor. Ele integra múltiplos motores especializados para aprender, evoluir e aprimorar seu próprio código continuamente.

Self-evolving AI general-purpose AI open-source AI Qwen2.5

DOCDEV.to AI·09/05/2026

How to Deploy Qwen2.5 72B with vLLM + FastAPI on a $20/Month DigitalOcean GPU Droplet: Production Inference at 1/90th Claude Cost

Este artigo detalha como implantar o modelo Qwen2.5 72B em um droplet de GPU da DigitalOcean por apenas US$ 20/mês. Ele oferece uma alternativa de baixo custo às APIs de LLM comerciais, prometendo inferência em produção com desempenho competitivo ao Claude 3.5 Sonnet e uma redução de custos de 98%.

learning Qwen2.5 Cost Optimization LLM deployment