← heapsort-ai

TensorRT

3 items

ARTICLE↑ trendingReddit r/MachineLearning·4/13/2026

TurboOCR: 270–1200 img/s OCR with Paddle + TensorRT (C++/CUDA, FP16) [P]

TurboOCR erreicht 270–1200 Bilder/s OCR durch Optimierung von PaddleOCR mit C++/CUDA, FP16 TensorRT, Fused Kernels und Batch-Verarbeitung, wodurch die Leistungsengpässe von VLM-basierten Ansätzen behoben werden. Diese Lösung verbessert den Durchsatz für die großflächige Dokumentenverarbeitung drastisch und eignet sich für Echtzeit-RAG-Anwendungen.

42
DOCDEV.to AI·vor 28T

How to Deploy Llama 3.2 Vision with TensorRT on a $20/Month DigitalOcean GPU Droplet: Multimodal Inference at 1/95th GPT-4 Vision Cost

Dieser Artikel beschreibt die Bereitstellung von Llama 3.2 Vision mit TensorRT auf einem DigitalOcean GPU Droplet, wodurch eine 3,5-mal schnellere multimodale Inferenz zu 1/95 der Kosten von GPT-4 Vision erreicht wird. Ziel ist es, Entwickler zu befähigen, Kosten und Leistung für Open-Source-Modelle zu optimieren und teure APIs sowie langsame lokale Inferenz zu vermeiden.

27