Gemma

33 items

ARTICLE↑ trendingReddit r/LocalLLaMA·14/04/2026

Gemma 4 31B — 4bit is all you need

Este artigo compara o desempenho das versões quantizadas de 4 bits e 8 bits do modelo Gemma 4 31B em um MacBook Pro M5 Max, revelando que a versão de 4 bits surpreendentemente obteve uma pontuação superior. Adicionalmente, destaca um problema onde o Gemma 4 26B-A4B entrou em um loop de regressão, atingindo o limite máximo de tokens e truncando as respostas.

4bit 8bit Gemma Quantization

NEWSDEV.to AI·2h atrás

Gemma 4 12B: Google's encoder-free multimodal AI now runs on a laptop

O Google lançou o Gemma 4 12B, um modelo de IA multimodal sem codificador que oferece desempenho próximo ao de modelos de 26B, mas roda em laptops de consumo com 16GB de RAM. Sua arquitetura inovadora permite que visão e áudio sejam processados diretamente pelo backbone do LLM, eliminando a necessidade de redes de codificação separadas.

AI models multimodal AI Gemma Google

ARTICLEAnalytics Vidhya·9h atrás

Google Gemma 4 12B: Architecture, Benchmarks, Access, and Hands-on Guide for Developers

Google lançou o Gemma 4 12B Unified, um modelo multimodal de código aberto para texto, imagem, áudio e vídeo, com uma janela de contexto de 256K e um design eficiente. A introdução levanta questões sobre a estratégia de IA mais ampla do Google.

multimodal AI Google AI open-source AI Gemma

NEWS↑ trendingReddit r/LocalLLaMA·15d atrás

LatitudeGames/Equinox-31B · Hugging Face

A LatitudeGames lançou o Equinox-31B, um novo modelo de IA baseado no Gemma 31B, ajustado para oferecer uma experiência equilibrada entre aventuras sombrias e narrativas cotidianas. O modelo é versátil e está disponível para uso na plataforma AIDungeon, mediante subscrição.

Finetuning AI gaming Gemma AI model

LatitudeGames/Equinox-31B · Hugging Face

RESEARCH↑ trendingReddit r/LocalLLaMA·22/04/2026

Personal Eval follow-up: Gemma4 26B MoE (Q8) vs Qwen3.5 27B Dense vs Gemma4 31B Dense Compared

Este acompanhamento compara os modelos Gemma4 26B MoE (Q8), Qwen3.5 27B Dense e Gemma4 31B Dense, incluindo resultados anteriores do Qwen 3.6 35B e Gemma 4 26B (Q4). A análise avalia o desempenho, destacando o impacto da quantização de 8 bits e a eficácia de diferentes arquiteturas de modelo.

benchmarking Gemma model comparison Quantization

NEWSDEV.to AI·1d atrás

Gemma 4 12B shows how far local multimodal AI has moved

O Gemma 4 12B do Google DeepMind é um modelo multimodal de IA notável, projetado para execução local e em dispositivos, facilitando o desenvolvimento de IA em laptops. Ele suporta entrada de texto, imagens e áudio nativo, simplificando a experimentação e os fluxos de trabalho no dispositivo para desenvolvedores.

AI models multimodal AI on-device AI Gemma

ARTICLE↑ trendingHacker News (AI)·5d atrás

Show HN: I made a Gemma 4 Mac app that names screenshots with local AI

Um desenvolvedor criou um aplicativo utilitário para macOS que utiliza o modelo local Gemma 4 para nomear capturas de tela. O app, com 5.3 GB devido ao modelo integrado, funciona bem na CPU e GPU Apple Silicon, destacando o potencial da IA local para ferramentas que priorizam a privacidade.

privacy Gemma Local AI AI

CASE↑ trendingReddit r/LocalLLaMA·11/04/2026

Gemma 4 26B A4B is still fully capable at 245283/262144 (94%) contex !

O modelo local Gemma 4 26B A4B demonstra capacidade excepcional ao operar com 94% de seu contexto de 262.144 tokens, resolvendo um problema que o Gemini 3.1 não conseguiu. Ele mantém alto desempenho e integridade mesmo sob uso intenso de VRAM com grande volume de dados de teste.

context window Gemma Local AI performance testing

RESEARCH↑ trendingReddit r/LocalLLaMA·14/04/2026

We benchmarked TranslateGemma-12b against 5 frontier LLMs on subtitle translation - it won across the board, with one significant catch

Um estudo comparou o TranslateGemma-12b com cinco LLMs de fronteira na tradução de legendas para seis pares de idiomas, revelando que o modelo específico para a tarefa superou consistentemente os modelos de propósito geral. Apesar dos números mostrarem uma vitória clara, a QA humana adicionou uma nuance importante que será detalhada no relatório completo.

translation Gemma benchmark AI

We benchmarked TranslateGemma-12b against 5 frontier LLMs on subtitle translation - it won across the board, with one significant catch

ARTICLE↑ trendingReddit r/LocalLLaMA·17/04/2026

Qwen 3.6 35B crushes Gemma 4 26B on my tests

O autor realizou um benchmark pessoal onde o Qwen 3.6 35B superou o Gemma 4 26B em testes que avaliam capacidades agenticas, codificação, síntese de imagem para texto, seguimento de instruções e raciocínio. O Qwen corrigiu mais problemas, teve menos regressões e completou os testes em menos tempo, demonstrando melhor desempenho geral.

LLM benchmarking Gemma Agentic AI Qwen

RESEARCH↑ trendingReddit r/MachineLearning·21/04/2026

156 landing-page generations through Gemma 4 31B with 52 different system prompts. Rule-dense "design heuristics" prompts scored below the empty baseline. [R]

Este conteúdo descreve uma pesquisa que gerou 156 landing pages usando o modelo Gemma 4 31B, empregando 52 prompts de sistema diferentes. Curiosamente, prompts com heurísticas de design densas em regras tiveram um desempenho inferior à linha de base vazia.

landing pages AI models Prompt Engineering benchmarking

DOC↑ trendingReddit r/LocalLLaMA·15/04/2026

Gemma 4 Jailbreak System Prompt

Este conteúdo aborda o "jailbreak" do modelo Gemma 4, focando na utilização de prompts de sistema para explorar vulnerabilidades. Ele discute as técnicas empregadas para contornar as salvaguardas e restrições do modelo de linguagem.

system prompt jailbreak security Gemma

ARTICLE↑ trendingReddit r/LocalLLaMA·16/04/2026

Gemma 4 31b 3D geometry

O autor expressa grande satisfação com a qualidade do Gemma 4, destacando sua capacidade de codificação e adaptabilidade em conversas e raciocínio. Um teste de geração de modelos 3D a partir de uma imagem de carro de F1 mostrou que o Gemma superou significativamente modelos como Claude Sonnet, Gemini Pro e ChatGPT, que apresentaram falhas notáveis.

AI models LLMs 3D Generation Gemma

ARTICLE↑ trendingReddit r/LocalLLaMA·21/04/2026

Gemma 4 Vision

O orçamento de visão padrão do Gemma 4 é frequentemente muito baixo para o reconhecimento detalhado eficaz, causando baixo desempenho em OCR. Os usuários podem aprimorar significativamente sua visão configurando parâmetros do `llama.cpp` como `--image-min-tokens` e `--image-max-tokens` para valores mais altos, como 560 e 2240.

optimization configuration Computer Vision Gemma

DOCDEV.to AI·1d atrás

What is Gemma 4 12B?

O Google lançou o Gemma 4 12B, um modelo multimodal de 11,95 bilhões de parâmetros que aceita texto, imagens, áudio e vídeo, e pode ser executado em um laptop. Ele se destaca por integrar diretamente dados brutos de imagem e áudio, eliminando codificadores separados, o que simplifica o desenvolvimento.

multimodal AI Google AI Gemma AI model

CASE↑ trendingReddit r/LocalLLaMA·08/04/2026

It finally happened, I actually had a use case for a local LLM and it was brilliant

O autor, durante um voo sem Wi-Fi e sofrendo de forte aerossinusite, utilizou um LLM local (Gemma 4) em seu laptop para encontrar uma solução. A IA sugeriu a Manobra de Toynbee, que aliviou com sucesso a dor, demonstrando uma aplicação prática e brilhante para a tecnologia de IA offline.

local LLM use case Gemma personal experience

ARTICLE↑ trendingReddit r/LocalLLaMA·19/04/2026

Gemma 4 - MLX doesn't seem better than GGUF

Um usuário compara o desempenho do modelo Gemma 4-26b-a4b nas versões MLX e GGUF em um M1 Max com 32GB de RAM. Os testes com um prompt de 3k tokens indicam que o GGUF é ligeiramente mais rápido tanto no processamento do prompt quanto nos tokens por segundo.

model performance apple-silicon Gemma MLX

ARTICLE↑ trendingReddit r/LocalLLaMA·21/04/2026

Did Google hide the best version of Gemma 4 e4b in Android? The extracted model beats Unsloth and everything else I've tried.

O usuário observou que uma versão do modelo Gemma 4 e4b extraída da Google AI Edge Gallery no Android tem desempenho superior e é mais inteligente do que as versões do Unsloth ou litertlm, apesar de ser ligeiramente menor. Ele questiona se o Google estaria ocultando uma versão otimizada e superior do modelo no Android.

model performance Google AI Android AI AI edge

NEWS↑ trendingReddit r/LocalLLaMA·10/04/2026

PSA: Gemma 4 template improvements

Uma solicitação de pull request foi mesclada, trazendo melhorias nas chamadas de ferramentas e conformidade de diálogo para o Gemma 4. Usuários são aconselhados a atualizar seus templates Jinja para obter melhores resultados.

Templates atualização ferramentas Gemma

ARTICLE↑ trendingReddit r/LocalLLaMA·09/04/2026

One year later: this question feels a lot less crazy

O autor reflete sobre o incrível progresso da IA local no último ano, notando que a comparação entre modelos locais e comerciais, antes impensável, agora é uma realidade. Ele expressa gratidão à comunidade e destaca os rápidos avanços que impulsionam a melhoria contínua da IA local.

OpenAI local LLM Gemma AI