← heapsort-ai

Gemma

33 items

ARTICLE↑ trendingReddit r/LocalLLaMA·14/04/2026

Gemma 4 31B — 4bit is all you need

Este artigo compara o desempenho das versões quantizadas de 4 bits e 8 bits do modelo Gemma 4 31B em um MacBook Pro M5 Max, revelando que a versão de 4 bits surpreendentemente obteve uma pontuação superior. Adicionalmente, destaca um problema onde o Gemma 4 26B-A4B entrou em um loop de regressão, atingindo o limite máximo de tokens e truncando as respostas.

Gemma 4 31B — 4bit is all you need
67
NEWS↑ trendingReddit r/LocalLLaMA·15d atrás

LatitudeGames/Equinox-31B · Hugging Face

A LatitudeGames lançou o Equinox-31B, um novo modelo de IA baseado no Gemma 31B, ajustado para oferecer uma experiência equilibrada entre aventuras sombrias e narrativas cotidianas. O modelo é versátil e está disponível para uso na plataforma AIDungeon, mediante subscrição.

LatitudeGames/Equinox-31B · Hugging Face
47
RESEARCH↑ trendingReddit r/LocalLLaMA·14/04/2026

We benchmarked TranslateGemma-12b against 5 frontier LLMs on subtitle translation - it won across the board, with one significant catch

Um estudo comparou o TranslateGemma-12b com cinco LLMs de fronteira na tradução de legendas para seis pares de idiomas, revelando que o modelo específico para a tarefa superou consistentemente os modelos de propósito geral. Apesar dos números mostrarem uma vitória clara, a QA humana adicionou uma nuance importante que será detalhada no relatório completo.

We benchmarked TranslateGemma-12b against 5 frontier LLMs on subtitle translation - it won across the board, with one significant catch
42
ARTICLE↑ trendingReddit r/LocalLLaMA·17/04/2026

Qwen 3.6 35B crushes Gemma 4 26B on my tests

O autor realizou um benchmark pessoal onde o Qwen 3.6 35B superou o Gemma 4 26B em testes que avaliam capacidades agenticas, codificação, síntese de imagem para texto, seguimento de instruções e raciocínio. O Qwen corrigiu mais problemas, teve menos regressões e completou os testes em menos tempo, demonstrando melhor desempenho geral.

42
RESEARCH↑ trendingReddit r/MachineLearning·21/04/2026

156 landing-page generations through Gemma 4 31B with 52 different system prompts. Rule-dense "design heuristics" prompts scored below the empty baseline. [R]

Este conteúdo descreve uma pesquisa que gerou 156 landing pages usando o modelo Gemma 4 31B, empregando 52 prompts de sistema diferentes. Curiosamente, prompts com heurísticas de design densas em regras tiveram um desempenho inferior à linha de base vazia.

42
DOC↑ trendingReddit r/LocalLLaMA·15/04/2026

Gemma 4 Jailbreak System Prompt

Este conteúdo aborda o "jailbreak" do modelo Gemma 4, focando na utilização de prompts de sistema para explorar vulnerabilidades. Ele discute as técnicas empregadas para contornar as salvaguardas e restrições do modelo de linguagem.

42
ARTICLE↑ trendingReddit r/LocalLLaMA·16/04/2026

Gemma 4 31b 3D geometry

O autor expressa grande satisfação com a qualidade do Gemma 4, destacando sua capacidade de codificação e adaptabilidade em conversas e raciocínio. Um teste de geração de modelos 3D a partir de uma imagem de carro de F1 mostrou que o Gemma superou significativamente modelos como Claude Sonnet, Gemini Pro e ChatGPT, que apresentaram falhas notáveis.

Gemma 4 31b 3D geometry
41
ARTICLE↑ trendingReddit r/LocalLLaMA·21/04/2026

Gemma 4 Vision

O orçamento de visão padrão do Gemma 4 é frequentemente muito baixo para o reconhecimento detalhado eficaz, causando baixo desempenho em OCR. Os usuários podem aprimorar significativamente sua visão configurando parâmetros do `llama.cpp` como `--image-min-tokens` e `--image-max-tokens` para valores mais altos, como 560 e 2240.

41
DOCDEV.to AI·1d atrás

What is Gemma 4 12B?

O Google lançou o Gemma 4 12B, um modelo multimodal de 11,95 bilhões de parâmetros que aceita texto, imagens, áudio e vídeo, e pode ser executado em um laptop. Ele se destaca por integrar diretamente dados brutos de imagem e áudio, eliminando codificadores separados, o que simplifica o desenvolvimento.

40
ARTICLE↑ trendingReddit r/LocalLLaMA·21/04/2026

Did Google hide the best version of Gemma 4 e4b in Android? The extracted model beats Unsloth and everything else I've tried.

O usuário observou que uma versão do modelo Gemma 4 e4b extraída da Google AI Edge Gallery no Android tem desempenho superior e é mais inteligente do que as versões do Unsloth ou litertlm, apesar de ser ligeiramente menor. Ele questiona se o Google estaria ocultando uma versão otimizada e superior do modelo no Android.

38
ARTICLE↑ trendingReddit r/LocalLLaMA·09/04/2026

One year later: this question feels a lot less crazy

O autor reflete sobre o incrível progresso da IA local no último ano, notando que a comparação entre modelos locais e comerciais, antes impensável, agora é uma realidade. Ele expressa gratidão à comunidade e destaca os rápidos avanços que impulsionam a melhoria contínua da IA local.

36