RESEARCH27
Benchmarking inference at scale: coding agents
Together AI Blog·19 de mayo de 2026
Este contenido presenta benchmarks de inferencia a escala para agentes de codificación, mostrando un 31% más de TPS que TensorRT-LLM y 2 veces mejor TTFT en saturación. Además, revela un costo un 76% menor en comparación con Claude Opus 4.6.
Leer original ↗