modelos de linguagem

8 items

ARTICLE↑ trendingReddit r/MachineLearning·4/12/2026

LLMs learn backwards, and the scaling hypothesis is bounded. [D]

Dieser Inhalt erörtert die Ansicht, dass Large Language Models (LLMs) invers lernen und die Skalierbarkeitshypothese inhärente Grenzen aufweist.

LLMs deep learning scaling hypothesis modelos de linguagem

ARTICLE↑ trendingReddit r/LocalLLaMA·4/9/2026

16 GB VRAM users, what model do we like best now?

Um usuário com 16 GB de VRAM compartilha sua experiência positiva com o modelo Qwen 3.5 27b em quants IQ3 em uma RTX 4080, alcançando boa velocidade e contexto. Ele discute os desafios de otimizar modelos de IA localmente com essa quantidade de VRAM, ponderando entre qualidade e velocidade ao lidar com diferentes níveis de quantização.

LLMs VRAM modelos de linguagem hardware

RESEARCHarXiv CS.CL·4/7/2026

Rethinking Token Prediction: Tree-Structured Diffusion Language Model

Este trabalho propõe um modelo de linguagem de difusão com estrutura de árvore para otimizar o treinamento e reduzir o uso de parâmetros e memória em modelos de difusão discretos. Ele substitui a previsão de vocabulário completo pela exploração da estrutura inerente dos tokens através de uma árvore de vocabulário pré-construída, utilizando estados latentes intermediários.

previsão de tokens árvore de vocabulário difusão discreta arquitetura de IA

ARTICLEQwen Blog·1/26/2025

Qwen2.5-1M: Deploy Your Own Qwen with Context Length up to 1M Tokens

Este conteúdo anuncia o lançamento dos modelos open-source Qwen2.5-1M (7B e 14B), que agora suportam um comprimento de contexto de até um milhão de tokens. Esta liberação expande as capacidades dos modelos Qwen para lidar com contextos extensos, seguindo a atualização da versão Turbo.

Contexto de 1M Open Source Inteligência Artificial modelos de linguagem

NEWSQwen Blog·7/22/2025

Qwen3-Coder: Agentic Coding in the World

Qwen3-Coder é um novo modelo de código agêntico, com destaque para a variante 480B-A35B-Instruct, que oferece 480 bilhões de parâmetros e suporta contextos de até 1 milhão de tokens. Ele estabelece novos recordes de desempenho em codificação agêntica, uso de navegador e ferramentas, comparável ao Claude Sonnet 4.

programação Agentes de IA IA Qwen3-Coder

NEWSQwen Blog·9/22/2025

Qwen3Guard: Real-time Safety for Your Token Stream

Qwen3Guard é o primeiro modelo de proteção de segurança da família Qwen, projetado para garantir interações de IA responsáveis. Baseado nos modelos Qwen3, ele oferece detecção precisa de segurança em prompts e respostas, com níveis de risco e classificações para moderação, alcançando desempenho de ponta em benchmarks multilíngues.

Moderação de Conteúdo IA Responsável modelos de linguagem Qwen

ARTICLEQwen Blog·1/28/2025

Qwen2.5-Max: Exploring the Intelligence of Large-scale MoE Model

O conteúdo explora a importância da escalabilidade contínua de dados e modelos (densos ou Mixture-of-Expert) para aprimorar a inteligência artificial, destacando a experiência limitada da comunidade na área. Menciona que detalhes críticos de escalabilidade foram recentemente divulgados pelo DeepSeek V3 e que o Qwen2 está em desenvolvimento.

IA modelos de linguagem MoE

ARTICLEDEV.to AI·4/12/2026

本地运行AI模型完整指南：用Ollama在电脑上跑GPT-4级模型

Dieser Artikel ist ein umfassender Leitfaden, wie man Ollama nutzt, um große Sprachmodelle (LLMs) lokal, kostenlos und privat auszuführen. Er beschreibt detailliert den Prozess der Bereitstellung leistungsstarker KI-Assistenten auf Ihrem Personal Computer, einschließlich Hardwareanforderungen und grundlegender Befehle.

IA Local Ollama privacidade código aberto