RESEARCH27

Benchmarking inference at scale: coding agents

Together AI Blog·19 mai 2026

Ce contenu présente des benchmarks d'inférence à grande échelle pour les agents de codage, montrant 31% de TPS en plus que TensorRT-LLM et un TTFT 2 fois meilleur à saturation. De plus, il révèle un coût 76% inférieur à celui de Claude Opus 4.6.

coding agents Benchmarking AI inference performance Cost Efficiency

Lire l'original ↗