RESEARCH27

Benchmarking inference at scale: coding agents

Together AI Blog·19 de mayo de 2026

Este contenido presenta benchmarks de inferencia a escala para agentes de codificación, mostrando un 31% más de TPS que TensorRT-LLM y 2 veces mejor TTFT en saturación. Además, revela un costo un 76% menor en comparación con Claude Opus 4.6.

coding agents Benchmarking AI inference performance Cost Efficiency

Leer original ↗