Qwen2.5

5 items

RESEARCH↑ trendingReddit r/MachineLearning·4/15/2026

Trained a Qwen2.5-0.5B-Instruct bf16 model on Reddit post summarization task with GRPO written from scratch in PyTorch - updates! [P]

Der Autor trainierte erfolgreich ein Qwen2.5-0.5B-Instruct Modell zur Reddit-Post-Zusammenfassung mittels GRPO, wobei eine durchschnittliche Ausgabelänge von 64 Tokens mit kombinierten Qualitäts- und Längenbelohnungen erreicht wurde. Das auf einem Mac Mini Cluster durchgeführte Experiment nutzt ein LLM-as-a-Judge (GPT-5) zur Evaluierung und plant zukünftige Iterationen mit angepassten Belohnungsfunktionen.

reinforcement learning Qwen2.5 GRPO Reddit

Trained a Qwen2.5-0.5B-Instruct bf16 model on Reddit post summarization task with GRPO written from scratch in PyTorch - updates! [P]

DOCDEV.to AI·4/25/2026

Tian AI Thinker: Building a Three-Layer LLM Reasoning Engine

Der Tian AI Thinker ist der kognitive Kern von Tian AI, der ein lokales Qwen2.5-1.5B-Modell über einen ThinkerRouter orchestriert. Dieser Router leitet Anfragen an drei verschiedene Denkmodi (Fast, CoT und Deep) weiter, die jeweils für unterschiedliche Anfragetypen optimiert sind.

AI architecture Qwen2.5 Reasoning LLM

ARTICLEDEV.to AI·4/25/2026

Tian AI: The Self-Evolving AI System Powered by Qwen2.5

Tian AI ist ein quelloffenes, selbsterwachendes Allzweck-KI-System, das von Qwen2.5-1.5B angetrieben wird und vollständig offline auf Consumer-Hardware betrieben werden kann. Es kombiniert mehrere spezialisierte Engines, um im Laufe der Zeit zu lernen, sich zu entwickeln und seinen eigenen Code zu verbessern.

Self-evolving AI AI system open-source AI Qwen2.5

ARTICLEDEV.to AI·4/27/2026

Tian AI: The Self-Evolving AI System Powered by Qwen2.5

Tian AI ist ein quelloffenes, selbstenwickelndes, allgemeines KI-System, das von Qwen2.5-1.5B angetrieben wird und vollständig offline auf Consumer-Hardware läuft. Es kombiniert mehrere spezialisierte Engines, um im Laufe der Zeit zu lernen, sich zu entwickeln und seinen eigenen Code zu verbessern.

Self-evolving AI general-purpose AI open-source AI Qwen2.5

DOCDEV.to AI·5/9/2026

How to Deploy Qwen2.5 72B with vLLM + FastAPI on a $20/Month DigitalOcean GPU Droplet: Production Inference at 1/90th Claude Cost

Dieser Artikel beschreibt detailliert, wie das Qwen2.5 72B-Modell für nur 20 $/Monat auf einem DigitalOcean GPU Droplet bereitgestellt werden kann. Es bietet eine kostengünstige Alternative zu kommerziellen LLM-APIs, verspricht Produktionsinferenz mit wettbewerbsfähiger Leistung zu Claude 3.5 Sonnet und eine Kostensenkung von 98 %.

learning Qwen2.5 Cost Optimization LLM deployment