点击小眼睛开启蜘蛛网特效

在NVIDIA Jetson TX2上源码编译并使用Pytorch

《在NVIDIA Jetson TX2上源码编译并使用Pytorch》

前言

TX2作为一个嵌入式平台的深度学习端,具备不错的GPU性能,我们可以发现TX2的GPU的计算能力是6.2。这意味着TX2对半精度运算有着良好的支持,我们完全可以在桌面端训练好模型,然后移植到TX2上利用半精度运行进行推理,这样可以达到生产落地的效果。

就算本篇文章主要展示了如何在TX2中源码编译Pytorch-1.0

首先我们需要一个相对纯净的jetpack系统,3.2-3.3版本(最新的4.1.1也可以)都可以,所以我们最好将TX2的系统重新刷一遍,以免造成一些其他不兼容的错误。

刷系统:从NVIDIA官网下载TX2的系统包:https://developer.nvidia.com/embedded/jetpack

《在NVIDIA Jetson TX2上源码编译并使用Pytorch》

步骤

接下来我们严格按照步骤来进行Pytorch的源码安装。

在JetPack-3.2系统中,我们的python一般有两个版本,python命令对应着python2.7。而python3命令对应着python3.5。这里我们使用python3作为编译环境,大家一定要分清楚这两个不同python版本的命令集,否则会造成编译错误。

可以通过which python3来查看当前的python3.5的执行环境。

依赖件

首先安装依赖件:

注意我们使用的命令pip3对应着python3,如果你不清楚系统中的pip和python的绑定信息,采用pip --version查看当前命令在哪个python中,例如我这边则是:

pip3 --version
pip3 9.0.1 from path/to/lib/python3.5/site-packages/pip (python 3.5)

总之我们要使用对应python3的pip命令,首先安装pip3,然后在python3环境中安装一些必要组件。

sudo apt install libopenblas-dev libatlas-dev liblapack-dev
sudo apt install liblapacke-dev checkinstall # For OpenCV
sudo apt-get install python3-pip

pip3 install --upgrade pip3==9.0.1
sudo apt-get install python3-dev

sudo pip3 install numpy scipy # 这个花费的时间略长,20分钟到30分钟左右
sudo pip3 install pyyaml
sudo pip3 install scikit-build
sudo apt-get -y install cmake
sudo apt install libffi-dev
sudo pip3 install cffi

安装完之后,我们添加cudnn的lib和include路径,为什么要执行这一步,因为我们在刷好机后,cuda和cudnn也已经安装好,但是JetPack系统中的cudnn路径和我们一般ubuntu系统中的路径略有不同(为什么不同看这里:https://oldpan.me/archives/pytorch-gpu-ubuntu-nvidia-cuda90),这时需要我们将cudnn的路径添加到环境变量中并激活:

sudo gedit ~/.bashrc
export CUDNN_LIB_DIR=/usr/lib/aarch64-linux-gnu
export CUDNN_INCLUDE_DIR=/usr/include
source ~/.bashrc

下载Pytorch源码包

我们从github上直接拷贝最新的Pytorch源码包,然后利用pip3安装好所有必备的库,并对第三方库进行更新。

git clone http://github.com/pytorch/pytorch
cd pytorch
sudo pip3 install -U setuptools
sudo pip3 install -r requirements.txt
git submodule update --init --recursive

编译

在编译之前,我们先开启TX2的最大功率模式,这样可以使我们的编译速度稍微快一些:

sudo nvpmodel -m 0         # 切换工作模式到最大
sudo  ~/jetson_clocks.sh   # 强制开启风扇最大转速 

这样风扇就开始呼呼转了,我们开始编译吧。

《在NVIDIA Jetson TX2上源码编译并使用Pytorch》

进入Pytorch源码目录后,我们首先执行下面这一句首先编译Pytorch的开发组件:

python3 setup.py build_deps

漫长的编译后(2小时),我们继续执行以下的命令:

NO_SYSTEM_NCCL=1 DEBUG=1 sudo python3 setup.py build develop

《在NVIDIA Jetson TX2上源码编译并使用Pytorch》

同样是漫长的编译(2小时),等待后不出意外就编译成功了!

后续操作

后续我们继续安装Pytorch推荐搭配的组件torchvision。

sudo apt clean
sudo apt-get install libjpeg-dev zlib1g-dev

git clone https://github.com/python-pillow/Pillow.git
cd Pillow/
sudo python3 setup.py install
sudo pip3 install pandas # ~20-30 min
sudo pip3 install Cython
sudo pip3 install scikit-image

sudo pip3 --no-cache-dir install torchvision

测试Pytorch是否安装成功

编译完成之后,如果安装成功,会出现下面的信息:

《在NVIDIA Jetson TX2上源码编译并使用Pytorch》

需要注意的点

在JetPack系统中,我们不论是执行编译还是执行代码,都必须加上sudo,否则会出现编译失败或者cuda error的情况。

参考

https://github.com/Bfzanchetta/DLARM/blob/master/jetsontx2/pytorch_install.sh

  点赞
本篇文章采用 署名-非商业性使用-禁止演绎 4.0 国际 进行许可
转载请务必注明来源: https://oldpan.me/archives/nvidia-jetson-tx2-source-build-pytorch

   关注Oldpan博客微信公众号,你最需要的及时推送给你。


  1. hjs说道:

    你好,我在tx2上使用pytorch进行半精度推理,但提速效果不是很明显,远没达到两倍的加速。然后同样的代码在1660ti上也是提速远没达到两倍的效果。就感觉tx2很好的支持半精度,但却没有明显加速

    1. Oldpan说道:

      那就说明还是不支持呀,顶多是显存空间省了一些,其他还是一样,半精度还是用TensorRT。

  2. fff说道:

    你好,在运行 python3 setup.py build_deps 时报错, error: invalid command 'build_deps',不知博主有没有遇到过,查了好久也没有找到解决方法

    1. wei_nir说道:

      我也遇到了同样的问题,请问层主解决了吗 :cry:

      1. moyoung说道:

        我也是,请问您解决了吗

  3. perry说道:

    请问编译的pytorch版本具体是多少?我用git checkout v1.0.0 编译的时候会出现缺少Capabilitydispatch.h文件。

    1. Oldpan说道:

      拷贝目前最新版本的Pytorch即可,我当时并不是stable版本,是发布日期前一天的nightly版。

      1. perry说道:

        我用的jepack3.3 CUDA9.0 CUDNN7.1.5。 在github上用最新的pytorch编译,出现了问题fatal error: Aten/native/cpu/CapbilityDispatch.h : No such file or directory。请问你有编译成功的wheel文件吗?

        1. Oldpan说道:

          没有wheel了,至于你说的问题我也没遇到过,实在不行可以尝试stable版前面一个版本的Pytorch进行编译。

  4. huaxia说道:

    您好,在进行“python3 setup.py build_deps”时发生错误“/usr/local/cuda/lib64/libcudnn.so.7: error adding symbols: File in wrong format
    collect2: error: ld returned 1 exit status
    caffe2/CMakeFiles/caffe2_gpu.dir/build.make:4933: recipe for target 'lib/libcaffe2_gpu.so' failed
    make[2]: *** [lib/libcaffe2_gpu.so] Error 1
    CMakeFiles/Makefile2:5107: recipe for target 'caffe2/CMakeFiles/caffe2_gpu.dir/all' failed
    make[1]: *** [caffe2/CMakeFiles/caffe2_gpu.dir/all] Error 2
    Makefile:140: recipe for target 'all' failed
    make: *** [all] Error 2”
    不知道您有没有碰到过?可否告知解决办法,谢谢。

    1. Oldpan说道:

      这个问题遇到过,一开始试了不同版本的cudnn和cuda,但是还是报错,最后只能抹了系统那纯净的系统编译才可以的。

      1. huaxia说道:

        您好,可以的话希望您能够说的具体详细一些,谢谢😜

        1. Oldpan说道:

          就是你的Jetpack系统最好重刷一遍,我当时是拿3.3的Jetpack版本编译的,按照我的步骤一次性就可以编译好。

  5. beta117说道:

    为什么上面安装依赖项都是pip3,下面安装编译却直接用python命令?
    python setup.py build_deps

    1. Oldpan说道:

      不好意思,是笔误,已修改,谢谢提醒~

Oldpan进行回复 取消回复

电子邮件地址不会被公开。 必填项已用*标注

评论审核已启用。您的评论可能需要一段时间后才能被显示。