我在服务器中推入镜像“nvcr.io/nvidia/tlt-streamanalytics:v3.0-dp-py3”其中包含tlt3.0,并且从pc端的浏览器成功登陆到服务器运行的jupyter notebook,如下图:
【图1】[attach]15793[/attach]
我使用自己的数据集在Faster-RCNN(resnet-18)中训练了一个单分类的目标检测模型,配置文件参数如下:
【图2】[attach]15794[/attach]
spec配置文件详见附件[attach]15801[/attach]
由于数据集较小,且只有一个分类,有过拟合的现象:
【图3】[attach]15795[/attach]
我将pth设为0.5进行了模型裁剪,并重新训练了裁剪后的模型:
【图4】[attach]15796[/attach]
【图5】[attach]15797[/attach]
在tlt中导出.etlt文件,在xavier中使用tlt-converter转换为.engine文件,均为fp16:
【图6】[attach]15798[/attach]
【图7】[attach]15799[/attach]
最后使用Deepstream-5.1调用.engine文件生成管道,但是推出的视频流fps仅有6左右,在nano平台更低:
【图8】[attach]15800[/attach]
以xavier的算力来看这个速度太慢了,请问是我在那一步操作中存在问题,谢谢。
首先,你需要看一下,你的Xavier是高频率模式还是低频率模式,你可以使用下面的命令来切换
sudo nvpmodel -m 0
sudo jetson_clocks
其次,我感觉这个Faster-rcnn的效果本身并不会太快
我运行在下图中的模式2,是您说的高功耗模式吗?
[attach]15815[/attach]
我曾使用tlt2.0训练过这个模型,导出模型运行起来的fps是现在是2倍,我不知道是哪一步出现了问题,我会再尝试训练别的模型。
不好意思,我的回复重新建楼了