TensorRT

3 items

ARTICLE↑ trendingReddit r/MachineLearning·13/04/2026

TurboOCR: 270–1200 img/s OCR with Paddle + TensorRT (C++/CUDA, FP16) [P]

O TurboOCR alcança 270–1200 img/s de OCR otimizando o PaddleOCR com C++/CUDA, TensorRT FP16, kernels fundidos e processamento em lote, resolvendo gargalos de desempenho em abordagens baseadas em VLM. Esta solução melhora drasticamente a vazão para processamento de documentos em larga escala e é adequada para aplicações RAG em tempo real.

CUDA Performance optimization TensorRT C++

DOCDEV.to AI·28d atrás

How to Deploy Llama 3.2 Vision with TensorRT on a $20/Month DigitalOcean GPU Droplet: Multimodal Inference at 1/95th GPT-4 Vision Cost

Este artigo detalha a implantação do Llama 3.2 Vision com TensorRT em um Droplet de GPU DigitalOcean, alcançando inferência multimodal 3,5x mais rápida e a 1/95 do custo do GPT-4 Vision. Ele visa capacitar desenvolvedores a otimizar custos e desempenho para modelos de código aberto, evitando APIs caras e inferência local lenta.

Llama 3.2 Vision learning TensorRT AI deployment

ARTICLEDEV.to AI·12/04/2026

Stop Choosing Between Speed and LoRAs: Meet ComfyUI-TensorRT-Reforge 🚀

Este artigo apresenta o ComfyUI-TensorRT-Reforge, um novo nó personalizado para ComfyUI que acelera a inferência de modelos de IA com TensorRT, permitindo o uso de LoRAs. Ele resolve o problema da geração lenta de imagens e as limitações de outras soluções existentes.

AI acceleration image generation TensorRT LoRAs