← heapsort-ai

TensorRT

3 items

ARTICLE↑ trendingReddit r/MachineLearning·13/04/2026

TurboOCR: 270–1200 img/s OCR with Paddle + TensorRT (C++/CUDA, FP16) [P]

TurboOCR atteint 270 à 1200 images/s en optimisant PaddleOCR avec C++/CUDA, TensorRT FP16, des kernels fusionnés et un traitement par lots, résolvant les goulots d'étranglement de performance des approches basées sur VLM. Cette solution améliore considérablement le débit pour le traitement de documents à grande échelle et convient aux applications RAG en temps réel.

42
DOCDEV.to AI·il y a 28j

How to Deploy Llama 3.2 Vision with TensorRT on a $20/Month DigitalOcean GPU Droplet: Multimodal Inference at 1/95th GPT-4 Vision Cost

Cet article détaille le déploiement de Llama 3.2 Vision avec TensorRT sur un Droplet GPU DigitalOcean, offrant une inférence multimodale 3,5 fois plus rapide et coûtant 95 fois moins que GPT-4 Vision. Il vise à aider les développeurs à optimiser les coûts et les performances des modèles open source, en évitant les API coûteuses et l'inférence locale lente.

27