TensorRT

3 items

ARTICLE↑ trendingReddit r/MachineLearning·13/04/2026

TurboOCR: 270–1200 img/s OCR with Paddle + TensorRT (C++/CUDA, FP16) [P]

TurboOCR atteint 270 à 1200 images/s en optimisant PaddleOCR avec C++/CUDA, TensorRT FP16, des kernels fusionnés et un traitement par lots, résolvant les goulots d'étranglement de performance des approches basées sur VLM. Cette solution améliore considérablement le débit pour le traitement de documents à grande échelle et convient aux applications RAG en temps réel.

CUDA Performance optimization TensorRT C++

DOCDEV.to AI·il y a 28j

How to Deploy Llama 3.2 Vision with TensorRT on a $20/Month DigitalOcean GPU Droplet: Multimodal Inference at 1/95th GPT-4 Vision Cost

Cet article détaille le déploiement de Llama 3.2 Vision avec TensorRT sur un Droplet GPU DigitalOcean, offrant une inférence multimodale 3,5 fois plus rapide et coûtant 95 fois moins que GPT-4 Vision. Il vise à aider les développeurs à optimiser les coûts et les performances des modèles open source, en évitant les API coûteuses et l'inférence locale lente.

Llama 3.2 Vision learning TensorRT AI deployment

ARTICLEDEV.to AI·12/04/2026

Stop Choosing Between Speed and LoRAs: Meet ComfyUI-TensorRT-Reforge 🚀

Cet article présente ComfyUI-TensorRT-Reforge, un nouveau nœud personnalisé pour ComfyUI qui accélère l'inférence des modèles d'IA avec TensorRT, permettant l'utilisation de LoRAs. Il résout le problème de la génération lente d'images et les limites des solutions existantes, combinant vitesse et flexibilité.

AI acceleration image generation TensorRT LoRAs