RESEARCH27

Benchmarking inference at scale: coding agents

Together AI Blog·19. Mai 2026

Dieser Inhalt präsentiert Inferenz-Benchmarks im großen Maßstab für Codierungsagenten, die 31% mehr TPS als TensorRT-LLM und eine 2-mal bessere TTFT bei Sättigung aufweisen. Zudem werden 76% geringere Kosten im Vergleich zu Claude Opus 4.6 demonstriert.

coding agents Benchmarking AI inference performance Cost Efficiency

Original lesen ↗