Tokenization

11 items

ARTICLE↑ trendingHacker News (AI)·17h atrás

Ask HN: What works for cutting AI token costs?

O usuário está enfrentando altos custos com tokens de LLM e busca estratégias práticas e reais para reduzir essas despesas, além de mudar para modelos mais baratos. Ele procura conselhos de quem já implementou com sucesso medidas de economia em suas aplicações de IA.

Cost Optimization AI Tokenization Real Applications

RESEARCH↑ trendingReddit r/MachineLearning·19d atrás

Do VLMs in production still use fixed-patch ViTs for their vision capabilities? [D]

Esta discussão questiona se os Modelos de Linguagem Visual (VLMs) em produção ainda utilizam ViTs de patch fixo para suas capacidades de visão, apesar da existência de métodos de tokenização mais eficientes. Explora possíveis razões para isso, como ganhos marginais, limitações de pipeline ou leis de escala não compreendidas para o "patching" adaptativo.

VLMs deep learning Vision Transformers Tokenization

ARTICLEDEV.to AI·18/04/2026

Tokenizer de Claude 4.7: 1.47x más tokens medidos vs Claude 4.6

El tokenizer de Claude 4.7 consume 1.47 veces más tokens en mediciones empíricas que el 4.6, superando la estimación oficial de Anthropic. Esto implica que los prompts cuestan más en la práctica, aunque el precio por token se mantiene idéntico, levantando la cuestión del valor del intercambio.

Tokenization Cost analysis LLM

RESEARCHarXiv CS.LG·11d atrás

Continuity and Ordinality Matter: Constraining Time Series Tokens for Effective Time Series Analysis with Large Language Models

Este artigo apresenta o COM (Continuity and Ordinality Matter), uma estratégia que integra restrições geométricas na inicialização e treinamento de modelos de linguagem grandes baseados em tokens (TS-LLMs) para análise de séries temporais. A pesquisa demonstra que preservar a continuidade e a ordinalidade nos embeddings de tokens melhora significativamente o desempenho e a generalizabilidade desses modelos.

machine learning Tokenization large language models Time Series Analysis

RESEARCHarXiv CS.AI·13d atrás

BrickAnything: Geometry-Conditioned Buildable Brick Generation with Structure-Aware Tokenization

O trabalho introduz o BrickAnything, uma estrutura autoregressiva condicionada à geometria para gerar estruturas de tijolos fisicamente construíveis a partir de formas 3D diversas. Ele utiliza nuvens de pontos como interface geométrica unificada e prevê sequências de tijolos que reconstroem a forma alvo sob restrições de montagem, introduzindo tokenização de árvore sensível à estrutura.

brick generation 3D reconstruction geometry-conditioned AI

DOCDEV.to AI·14d atrás

How LLMs Actually Work — From Tokens to Text (with Python)

Este conteúdo explica o mecanismo fundamental dos Modelos de Linguagem Grandes (LLMs) como o ChatGPT, detalhando como eles preveem o próximo token para gerar texto. Descreve o pipeline desde a tokenização e representação vetorial até os mecanismos de atenção e o processo iterativo de geração de texto.

learning text generation Python Tokenization

ARTICLEDEV.to AI·18/04/2026

Opus 4.7 Uses 35% More Tokens Than 4.6. Here's What I'm Doing About It.

O novo tokenizer do Claude Opus 4.7 está resultando em um aumento efetivo de 35% no custo para o mesmo trabalho, pois consome mais tokens que a versão 4.6. Embora a qualidade das tarefas complexas melhore, o autor planeja usar seletivamente o 4.7 e manter o 4.6 para tarefas onde a eficiência de tokens é crucial.

AI cost Claude Tokenization LLM

ARTICLEDEV.to AI·21/04/2026

Opus 4.7's Tokenizer Change: How to Measure Your Real Claude Code Costs

A atualização do tokenizador do Claude Opus 4.7 pode aumentar os custos em até 40% ou mais para a mesma entrada, especialmente para prompts do sistema e imagens de alta resolução, devido ao maior número de tokens. É crucial usar um contador de tokens para medir os custos reais antes de fazer o upgrade.

AI models Anthropic Cost Optimization Tokenization

DOCfast.ai Blog·15/10/2025

Let’s Build the GPT Tokenizer: A Complete Guide to Tokenization in LLMs

Este conteúdo transforma um vídeo de Andrej Karpathy sobre tokenização de GPT num capítulo de livro detalhado. Inclui código e imagens, servindo como um guia completo para entender um aspeto fundamental do funcionamento dos LLMs.

LLMs GPT learning NLP

Let’s Build the GPT Tokenizer: A Complete Guide to Tokenization in LLMs

ARTICLEDEV.to AI·20/04/2026

How do large organizations benefit from tokenizing physical assets?

Grandes organizações se beneficiam da tokenização de ativos físicos, transformando bens ilíquidos em unidades digitais negociáveis em blockchain. Isso melhora a liquidez, a transparência e a eficiência operacional na gestão de ativos.

Blockchain Finance digital assets asset management

ARTICLEDEV.to AI·10/04/2026

U.S. Blockchain Development Accelerates With Asset Tokenization and Layer 2 Growth

O desenvolvimento de blockchain nos EUA evoluiu de experimentação para infraestrutura real em 2026, impulsionado pela tokenização de ativos e soluções Layer 2. Isso tornou a tecnologia mais prática, escalável e econômica para empresas em setores como finanças e logística.

Blockchain enterprise blockchain Tokenization Layer 2