语义分割模型转化为ncnn后在pc和arm上都很慢

p4tfgftt 于 2022-12-31 发布在其他

关注(0)|答案(6)|浏览(132)

语义分割模型icnet转为ncnn后，和caffe用cpu推理时间作比较，在pc上慢了一倍多，嵌入式arm平台上慢了好几倍。

来源：https://github.com/Tencent/ncnn/issues/1166

6条答案

按热度按时间

可能是用了比较多的 deconvolution？建议改为 upsampling + conv

赞(0）回复(0）举报 2022-12-31

可能是用了比较多的 deconvolution？建议改为 upsampling + conv

没有使用deconvolution层，用的时interp层

赞(0）回复(0）举报 2022-12-31

编译时没有开启 neon 吗？
观察下编译过程中，是不是 src/layer/arm/xxxx_arm.cpp

赞(0）回复(0）举报 2022-12-31

原模型的耗时时长多少，在cpu下还是gpu下什么框架跑得呢

赞(0）回复(0）举报 2022-12-31

原模型的耗时时长多少，在cpu下还是gpu下什么框架跑得呢

在cpu下跑，arm下，转ncnn速度慢到1500ms，后面尝试mnn速度120ms

赞(0）回复(0）举报 2022-12-31

编译时没有开启 neon 吗？
观察下编译过程中，是不是 src/layer/arm/xxxx_arm.cpp

我的编译的时候开启了neon，也加载了 layer/arm/XXX_arm.cpp：
[ 13%] Building CXX object src/CMakeFiles/ncnn.dir/layer/arm/batchnorm_arm.cpp.o
[ 19%] Building CXX object src/CMakeFiles/ncnn.dir/layer/arm/convolution_arm.cpp.o

85%] Building CXX object src/CMakeFiles/ncnn.dir/layer/arm/hardsigmoid_arm.cpp.o
[ 89%] Building CXX object src/CMakeFiles/ncnn.dir/layer/arm/hardswish_arm.cpp.o

但是移植后速度也还是很慢，800X800的单张要1.5s，227X227的大概500ms内。

赞(0）回复(0）举报 2022-12-31

相关问题

微信公众号

热门标签

Java query python Node 开发语言 request Util 数据库 Table 后端算法 Logger Message Element Parser

最新问答

Python pillow/PIL无法识别对象“imagedraw”的属性“textsize”
回答(3) 发布于 5个月前
python-3.x ImportError：无法从“typing_extensions”导入名称“deprecated”
回答(2) 发布于 5个月前
python-3.x 我正尝试使用密码学对字典进行加密
回答(1) 发布于 5个月前
在Python的IDLE中导入audiolazy的问题
回答(1) 发布于 5个月前
如何将Python程序中的数据添加到Markdown？
回答(2) 发布于 5个月前