Qwen2.5

5 items

RESEARCH↑ trendingReddit r/MachineLearning·15/04/2026

Trained a Qwen2.5-0.5B-Instruct bf16 model on Reddit post summarization task with GRPO written from scratch in PyTorch - updates! [P]

L'auteur a réussi à entraîner un modèle Qwen2.5-0.5B-Instruct pour la summarisation de posts Reddit en utilisant GRPO, atteignant une longueur moyenne de 64 tokens avec des récompenses de qualité et de pénalité de longueur. L'expérience, exécutée sur un cluster de Mac Minis, utilise un "LLM-as-a-Judge" (GPT-5) pour l'évaluation et prévoit de futures itérations avec des fonctions de récompense ajustées.

reinforcement learning Qwen2.5 GRPO Reddit

Trained a Qwen2.5-0.5B-Instruct bf16 model on Reddit post summarization task with GRPO written from scratch in PyTorch - updates! [P]

DOCDEV.to AI·25/04/2026

Tian AI Thinker: Building a Three-Layer LLM Reasoning Engine

Le Tian AI Thinker est le cœur cognitif de Tian AI, orchestrant un modèle local Qwen2.5-1.5B via un ThinkerRouter. Ce routeur distribue les requêtes à trois modes de raisonnement distincts (Fast, CoT et Deep), chacun optimisé pour différents types de requêtes.

AI architecture Qwen2.5 Reasoning LLM

ARTICLEDEV.to AI·25/04/2026

Tian AI: The Self-Evolving AI System Powered by Qwen2.5

Tian AI est un système d'IA auto-évolutif et open-source à usage général, alimenté par Qwen2.5-1.5B, capable de fonctionner entièrement hors ligne sur du matériel grand public. Il combine plusieurs moteurs spécialisés pour apprendre, évoluer et améliorer son propre code au fil du temps.

Self-evolving AI AI system open-source AI Qwen2.5

ARTICLEDEV.to AI·27/04/2026

Tian AI: The Self-Evolving AI System Powered by Qwen2.5

Tian AI est un système d'IA open-source, auto-évolutif et à usage général, alimenté par Qwen2.5-1.5B, conçu pour fonctionner complètement hors ligne sur du matériel grand public. Il combine plusieurs moteurs spécialisés pour apprendre, évoluer et améliorer son propre code au fil du temps.

Self-evolving AI general-purpose AI open-source AI Qwen2.5

DOCDEV.to AI·09/05/2026

How to Deploy Qwen2.5 72B with vLLM + FastAPI on a $20/Month DigitalOcean GPU Droplet: Production Inference at 1/90th Claude Cost

Cet article explique comment déployer le modèle Qwen2.5 72B sur un Droplet GPU DigitalOcean pour seulement 20 $/mois. Il offre une alternative économique aux API LLM commerciales, promettant une inférence en production avec des performances comparables à Claude 3.5 Sonnet et une réduction de coût de 98 %.

learning Qwen2.5 Cost Optimization LLM deployment