|
发表于 2024-10-14 13:54:01
|
显示全部楼层
PyTorch版的YOLOv5是高性能的实时目标检测方法。 TensorRT是针对NVIDIA的GPU加速工具。TensorRT是NVIDIA 推出的一款基于CUDA和cudnn的神经网络推断加速引擎,可提高了深度学习模型在边缘设备上的推理速度。 在计算资源并不丰富的嵌入式设备上,TensorRT之所以能加速神经网络的的推理主要得益于两点。首先是TensorRT支持INT8和FP16的计算,通过在减少计算量和保持精度之间达到一个理想的trade-off,达到加速推断的目的。更为重要的是TensorRT对于网络结构进行了重构和优化。 |
|