RESEARCH27
Benchmarking inference at scale: coding agents
Together AI Blog·19 mai 2026
Ce contenu présente des benchmarks d'inférence à grande échelle pour les agents de codage, montrant 31% de TPS en plus que TensorRT-LLM et un TTFT 2 fois meilleur à saturation. De plus, il révèle un coût 76% inférieur à celui de Claude Opus 4.6.
Lire l'original ↗