← heapsort-ai

Gemma 4

34 items

ARTICLE↑ trendingReddit r/MachineLearning·18/4/2026

Trials and tribulations fine-tuning & deploying Gemma-4 [P]

Un equipo de ML documentó los desafíos técnicos encontrados al afinar y desplegar Gemma-4. Los problemas clave incluyeron la incompatibilidad de PEFT con las capas personalizadas de Gemma 4, SFTTrainer rompiendo silenciosamente la atención de intercambio KV, y DeepSpeed ZeRO-3 guardando adaptadores LoRA medio vacíos.

46
RESEARCH↑ trendingReddit r/LocalLLaMA·18/4/2026

Accidentally discovered you can teach frozen MoE models new knowledge by just steering their expert routing — no training needed

Un nuevo método permite enseñar nuevos conocimientos a modelos MoE "congelados" dirigiendo su enrutamiento de expertos, sin necesidad de entrenamiento tradicional. Denominada Inteligencia Cognitiva Adaptativa (ACI), esta técnica demostró corregir errores fácticos en Gemma 4 usando solo un pequeño archivo de configuración.

42
NEWS↑ trendingReddit r/LocalLLaMA·11/4/2026

Unsloth updated all Gemma-4 uploads

El equipo de Unsloth ha actualizado todas sus cargas del modelo Gemma-4, incluyendo una plantilla de chat mejorada y otras posibles mejoras. Se recomienda a los usuarios que vuelvan a descargar los modelos para obtener estas actualizaciones, que demuestran el apoyo continuo de Unsloth al lanzamiento de Gemma-4.

38
NEWS↑ trendingReddit r/LocalLLaMA·10/4/2026

More Gemma4 fixes in the past 24 hours

Este conteúdo relata correções recentes e novos templates de chat para os modelos Gemma 4 do Google, visando melhorar o orçamento de raciocínio e a chamada de ferramentas. Ele oferece instruções para usuários de llama.cpp sobre como aplicar esses novos templates para garantir o funcionamento correto.

36
ARTICLEDEV.to AI·hace 8d

Building the Future of Local AI Intelligence

Gemma 4 es una nueva familia de modelos de IA diseñada para llevar inteligencia local y controlada por desarrolladores, pasando la IA de sistemas solo en la nube a soluciones locales. Ofrece un razonamiento potente, ventanas de contexto amplias para bases de código completas y una implementación local eficiente, reduciendo la dependencia de las API en la nube.

29
ARTICLEDEV.to AI·8/5/2026

Built a Multimodal Emergency First Aid Assistant with Gemma 4 — Here's What the Model Unlocked

Este artículo describe la creación de Med-first, un asistente multimodal de primeros auxilios basado en navegador, construido con el modelo Gemma 4. El autor explora cómo Gemma 4 permitió desarrollar una IA que puede guiar a las personas en emergencias médicas sin escribir, destacando su importancia para los desarrolladores con acceso limitado a la computación.

28
CASEDEV.to AI·8/5/2026

Local AI Assistant powered by Gemma 4

Reiseki es un asistente de IA local que utiliza Gemma 4 a través de Ollama para manejar tareas reales como la lectura/escritura de archivos y la generación de documentos. Está diseñado para usuarios no técnicos, con un instalador de Windows simple que recuerda el contexto y ofrece una interfaz fácil de usar.

27
ARTICLEDEV.to AI·13/4/2026

Gemma 4 and the Architecture of On-Device AI

El anuncio de Gemma 4 de Google indica un cambio arquitectónico fundamental hacia la IA en el dispositivo, priorizando la computación distribuida y local sobre la inferencia centralizada en la nube. Esto invierte el enfoque tradicional de escalar modelos, centrándose ahora en las limitaciones de eficiencia de los dispositivos de consumo como los smartphones.

27