← heapsort-ai

TensorRT

3 items

ARTICLE↑ trendingReddit r/MachineLearning·13/04/2026

TurboOCR: 270–1200 img/s OCR with Paddle + TensorRT (C++/CUDA, FP16) [P]

O TurboOCR alcança 270–1200 img/s de OCR otimizando o PaddleOCR com C++/CUDA, TensorRT FP16, kernels fundidos e processamento em lote, resolvendo gargalos de desempenho em abordagens baseadas em VLM. Esta solução melhora drasticamente a vazão para processamento de documentos em larga escala e é adequada para aplicações RAG em tempo real.

42
DOCDEV.to AI·28d atrás

How to Deploy Llama 3.2 Vision with TensorRT on a $20/Month DigitalOcean GPU Droplet: Multimodal Inference at 1/95th GPT-4 Vision Cost

Este artigo detalha a implantação do Llama 3.2 Vision com TensorRT em um Droplet de GPU DigitalOcean, alcançando inferência multimodal 3,5x mais rápida e a 1/95 do custo do GPT-4 Vision. Ele visa capacitar desenvolvedores a otimizar custos e desempenho para modelos de código aberto, evitando APIs caras e inferência local lenta.

27