欢迎光临散文网 会员登陆 & 注册

自动驾驶之心CUDA与TensorRT部署实战课程

2023-08-02 16:50 作者:bili_34189062872  | 我要投稿

TensorRT是一个高性能的深度学习推理优化器,可以为深度学习应用提供低延迟、高吞吐率的部署推理。TensorRT可用于对超大规模数据中心、嵌入式平台或自动驾驶平台进行推理加速。TensorRT现在已能支持TensorFlowCaffeMxnetPytorch等几乎所有的深度学习框架,将TensorRTNVIDIAGPU结合起来,能在几乎所有的框架中进行快速和高效的部署推理。目前的TensorRT库支持C ++或者Python API部署。

为什么对推理过程进行优化

深度学习模型一般分为训练(training)和 推理(inference)两个部分:

  1. 训练: 训练包含了前向传播和后向传播两个阶段,针对的是训练集。训练时通过误差反向传播来不断修改网络权值。

  2. 推理: 推理只包含前向传播一个阶段,针对的是除了训练集之外的新数据。可以是测试集,但不完全是,更多的是整个数据集之外的数据。其实就是针对新数据进行预测,预测时,速度是一个很重要的因素。


自动驾驶之心CUDA与TensorRT部署实战课程的评论 (共 条)

分享到微博请遵守国家法律