← heapsort-ai

Tokenization

11 items

ARTICLE↑ trendingHacker News (AI)·il y a 17h

Ask HN: What works for cutting AI token costs?

L'utilisateur rencontre des coûts de jetons LLM élevés et recherche des stratégies pratiques et concrètes pour réduire ces dépenses, au-delà du simple changement vers des modèles moins chers. Il demande des conseils à ceux qui ont mis en œuvre avec succès des mesures de réduction des coûts dans leurs applications d'IA.

68
RESEARCH↑ trendingReddit r/MachineLearning·il y a 19j

Do VLMs in production still use fixed-patch ViTs for their vision capabilities? [D]

Cette discussion se demande si les Modèles de Langage Visuel (VLMs) en production utilisent toujours des Vision Transformers (ViTs) à patchs fixes pour leurs capacités visuelles, malgré l'existence de méthodes de tokenisation plus efficaces. Elle explore les raisons possibles de cette situation, telles que des gains marginaux, des limitations de pipeline ou des lois d'échelle mal comprises pour le "patching" adaptatif.

42
RESEARCHarXiv CS.LG·il y a 11j

Continuity and Ordinality Matter: Constraining Time Series Tokens for Effective Time Series Analysis with Large Language Models

Cet article présente COM (Continuity and Ordinality Matter), une stratégie qui intègre des contraintes géométriques dans les phases d'initialisation et d'entraînement des grands modèles linguistiques basés sur des jetons (TS-LLMs) pour l'analyse des séries temporelles. La recherche démontre que la préservation de la continuité et de l'ordinalité dans les embeddings de jetons des séries temporelles améliore considérablement les performances et la généralisabilité du modèle.

27
RESEARCHarXiv CS.AI·il y a 13j

BrickAnything: Geometry-Conditioned Buildable Brick Generation with Structure-Aware Tokenization

Ce travail présente BrickAnything, un cadre autorégressif conditionné par la géométrie pour générer des structures de briques physiquement constructibles à partir de diverses formes 3D. Il utilise des nuages de points comme interface géométrique unifiée et prédit des séquences de briques qui reconstruisent la forme cible sous contraintes d'assemblage, en introduisant une tokenisation d'arbre sensible à la structure.

27
ARTICLEDEV.to AI·18/04/2026

Opus 4.7 Uses 35% More Tokens Than 4.6. Here's What I'm Doing About It.

Le nouveau tokenizer de Claude Opus 4.7 entraîne une augmentation effective de 35 % du coût pour le même travail, consommant plus de tokens que la version 4.6. Malgré les améliorations de raisonnement pour les tâches complexes, l'auteur prévoit d'utiliser 4.7 de manière sélective et de conserver 4.6 pour les tâches où l'efficacité des tokens est primordiale.

27