← heapsort-ai

Qwen

46 items

ARTICLE↑ trendingReddit r/LocalLLaMA·23/4/2026

POV Qwen 3.5 with thinking

Este contenido aborda el comportamiento del modelo de IA Qwen 3.5, que frecuentemente se queda atascado en bucles de pensamiento. El autor hace una observación breve e informal sobre esta característica del modelo.

POV Qwen 3.5 with thinking
47
ARTICLE↑ trendingReddit r/LocalLLaMA·17/4/2026

Qwen 3.6 is the first local model that actually feels worth the effort for me

El autor considera a Qwen 3.6 el primer modelo local que realmente vale la pena, a diferencia de experiencias anteriores donde los modelos eran débiles o requerían mucho esfuerzo. Funcionando en un sistema con 5090 + 4090, el modelo Q8 ofrece 260k de contexto y 170 tokens/segundo, siendo eficaz para tareas de codificación como UI XML y C++ embebido.

46
CASE↑ trendingReddit r/LocalLLaMA·17/4/2026

Qwen3.6 is incredible with OpenCode!

El usuario elogia a Qwen3.6 OpenCode como un modelo local "increíble" para tareas de codificación complejas, destacando su eficacia en la implementación de RLS en una base de código multilingüe. Aunque no es perfecto, su capacidad para iterar sobre errores de compilación lo convierte en una alternativa viable a modelos como Claude Code para uso diario.

44
CASE↑ trendingReddit r/LocalLLaMA·17/4/2026

Qwen3.6. This is it.

Un usuario relata su experiencia con el modelo Qwen3.6, que construyó y probó con éxito un juego de defensa de torres, demostrando la capacidad de identificar y corregir sus propios errores. La IA confirmó las compilaciones usando capturas de pantalla, sorprendiendo al usuario con sus capacidades avanzadas.

Qwen3.6. This is it.
43
DOC↑ trendingReddit r/LocalLLaMA·6/5/2026

2.5x faster inference with Qwen 3.6 27B using MTP - Finally a viable option for local agentic coding - 262k context on 48GB - Fixed chat template - Drop-in OpenAI and Anthropic API endpoints

Este contenido detalla cómo lograr una inferencia 2.5 veces más rápida con Qwen 3.6 27B usando el soporte MTP en llama.cpp, alcanzando 28 tok/s en un M2 Max. Proporciona archivos GGUF convertidos para descargar, adecuados para codificación agéntica local con 262k de contexto en 48GB.

43
ARTICLE↑ trendingReddit r/LocalLLaMA·16/4/2026

PSA: Qwen3.6 ships with preserve_thinking. Make sure you have it on.

Qwen 3.6 ahora incluye una nueva bandera `preserve_thinking` que soluciona el problema de invalidación de la caché KV al mantener el contexto de razonamiento completo del modelo. Esta funcionalidad es especialmente beneficiosa para escenarios de agentes, mejorando la consistencia de las decisiones y optimizando el consumo de tokens y la utilización de la caché KV.

PSA: Qwen3.6 ships with preserve_thinking. Make sure you have it on.
43
NEWS↑ trendingReddit r/LocalLLaMA·22/4/2026

Qwen 3.6 27B is out

Se ha lanzado el modelo Qwen 3.6 27B, una nueva incorporación en el campo de los grandes modelos de lenguaje. El anuncio enlaza a la página oficial del modelo en Hugging Face para obtener más detalles.

42
DOC↑ trendingReddit r/LocalLLaMA·11/4/2026

Run Qwen3.5-397B-A13B with vLLM and 8xR9700

Este documento detalla la ejecución optimizada del modelo Qwen3.5-397B-A17B-MXFP4 utilizando vLLM en GPUs RDNA4, como 8xR9700. Incluye un Dockerfile con parches de Triton e instrucciones para descargar el modelo y lanzar el contenedor de inferencia.

42
DOC↑ trendingReddit r/LocalLLaMA·6/5/2026

Get faster qwen 3.6 27b

El contenido detalla cómo lograr un rendimiento más rápido con el modelo Qwen 3.6 27B usando llama.cpp en una GPU 3090. Incluye pasos para aplicar un commit específico y comandos de configuración de `llama-server` para alcanzar 50 t/s con 100k de contexto.

42
ARTICLE↑ trendingReddit r/LocalLLaMA·12/4/2026

MiniMax-M2.7 vs Qwen3.5-122B-A10B for 96GB VRAM full offload?!

El autor compara los modelos GGUF MiniMax-M2.7 y Qwen3.5-122B-A10B para descarga completa local en un equipo con 96GB de VRAM. Para sus propósitos, prefiere Qwen3.5-122B, a pesar de que MiniMax está más cuantificado, destacando las compensaciones en el rendimiento de la inferencia local de LLMs.

MiniMax-M2.7 vs Qwen3.5-122B-A10B for 96GB VRAM full offload?!
42
ARTICLE↑ trendingReddit r/LocalLLaMA·17/4/2026

Qwen 3.6 35B crushes Gemma 4 26B on my tests

El autor realizó una evaluación personal donde Qwen 3.6 35B superó a Gemma 4 26B en pruebas que evalúan capacidades agenticas, codificación, síntesis de imagen a texto, seguimiento de instrucciones y razonamiento. Qwen corrigió más problemas, tuvo menos regresiones y completó las pruebas en menos tiempo, mostrando un mejor rendimiento general.

42
RESEARCH↑ trendingReddit r/LocalLLaMA·6/5/2026

Quality comparison between Qwen 3.6 27B quantizations (BF16, Q8_0, Q6_K, Q5_K_XL, Q4_K_XL, IQ4_XS, IQ3_XXS,...)

El contenido compara la calidad de diferentes cuantizaciones del modelo Qwen 3.6 27B mediante una prueba de ajedrez para identificar la mejor opción para configuraciones con 16 GB de VRAM. La prueba evalúa la capacidad de los modelos para seguir el estado del tablero y generar imágenes SVG correctas.

Quality comparison between Qwen 3.6 27B quantizations (BF16, Q8_0, Q6_K, Q5_K_XL, Q4_K_XL, IQ4_XS, IQ3_XXS,...)
42
CASE↑ trendingReddit r/LocalLLaMA·18/4/2026

qwen3.6 performance jump is real, just make sure you have it properly configured

Un usuario informa que Qwen 3.6 muestra un salto de rendimiento significativo, demostrando ser capaz para cargas de trabajo típicamente manejadas por Opus y Codex, aunque no a su mismo nivel. El usuario resalta su utilidad y velocidad cuando se configura correctamente con `preserve_thinking` en un M5 Max con ajustes específicos.

qwen3.6 performance jump is real, just make sure you have it properly configured
42
DOC↑ trendingReddit r/LocalLLaMA·hace 27d

llama.cpp docker images to run MTP models

Este contenido describe la creación de imágenes Docker para `llama.cpp` con el fin de simplificar la ejecución de modelos MTP, tras numerosas mejoras y correcciones de errores. También señala que Unsloth ha lanzado nuevos modelos MTP para Qwen 3.6, lo que hace que las versiones anteriores queden obsoletas.

41