深度学习环境搭建:Ubuntu16.04+ python3.5+cuda8.0+Tensorflow1.4

Deep Learning是目前最火的机器学习领域,入门Deep learning从基础环境开始开始。本文介绍最常见的深度学习环境(Ubuntu+Cuda+Tensorflow)搭建过程,说明如何在众多发行版本的软件中选择适合自己的版本,节约踩坑的时间。

最近跟风在刷吴恩达老师的深度学习课程,开始一直在用anaconda安装tensorflow的CPU版本,但是发现这个速度很慢,再加上笔记本有GTX960m,不用起来也是浪费了。于是就开始折腾。

《深度学习环境搭建:Ubuntu16.04+ python3.5+cuda8.0+Tensorflow1.4》
《深度学习环境搭建:Ubuntu16.04+ python3.5+cuda8.0+Tensorflow1.4》

1.准备工作

准备工作非常非常重要,不然会踩无数的坑。

1.1 硬件准备

首先,我们需要确认我们的机器是否支持深度学习环境。简单的说就是有没有显卡,没有显卡就可以跳过我这篇文章了。

看一下我的硬件配置:

  • 笔记本:xps-15-9550
  • CPU:i5
  • 内存:8G×2
  • 显卡:GTX960m,2G显存
  • 硬盘:三星950SSD,126G

其中内存、CPU和显卡比较重要,深度学习对硬件还是有一定要求的,具体的请百度或者Google看一下。

1.2 软件准备

我的深度学习环境是:Ubuntu16.04,Python3.5,Cuda8.0,Tensorflow1.4。

网上已经有很多的大神分享过自己的深度学习搭建过程,我参考了很多作者的经验。刚开始的时候,发现网上各种软件版本不一样,整得新手云里雾里,我分享一些我踩过坑之后的经验。

搭建深度学习环境需要用到很多的库,这些库与库之间是有依赖关系的,比如:Tensorflow1.4只能安装在python3.5而不能安装在python3.6,Cuda9.0安装Tensorflow会有各种各样的问题等。

我就一步一步说:

第一:Ubuntu16.04操作系统。主流的操作系统有windows、Mac os和Linux,显然选择windows和mac os并不是一个明智的选择,因此我们选择用比较流行的Linux发行版本Ubuntu16.04。

《深度学习环境搭建:Ubuntu16.04+ python3.5+cuda8.0+Tensorflow1.4》
《深度学习环境搭建:Ubuntu16.04+ python3.5+cuda8.0+Tensorflow1.4》

第二:python3.5。python因为历史遗留问题,现在有python2和python3两个大版本同时发行。Python社区(包括Numpy、Pandas)在内的很多维护者已经公开说明将在2020年之前放弃支持python2版本,因此我们的选择也只剩下python3了。我在安装的过程中还发现python3.6无法安装GPU支持的Tensorflow,所以我使用的是python3.5。

《深度学习环境搭建:Ubuntu16.04+ python3.5+cuda8.0+Tensorflow1.4》
《深度学习环境搭建:Ubuntu16.04+ python3.5+cuda8.0+Tensorflow1.4》

第三:Cuda8.0。根据之前大神们的分享,目前Ubuntu16.04对cuda8.0的版本支持较好,同时Tensorflow对cuda9.0不太友好,因此我们选择Cuda8.0。

《深度学习环境搭建:Ubuntu16.04+ python3.5+cuda8.0+Tensorflow1.4》
《深度学习环境搭建:Ubuntu16.04+ python3.5+cuda8.0+Tensorflow1.4》

2.环境搭建

  • 安装Ubuntu16.04
  • 安装GTX960m驱动
  • 安装Cuda8.0
  • 安装cuDNN6.0
  • 安装Tensorflow1.4

2.1 安装Ubuntu16.04

从Ubuntu官网下载镜像,并用U盘安装。

安装完成之后更新系统。

sudo apt-get update sudo apt-get upgrade

2.2 安装GTX960m显卡驱动

由于默认Ubuntu系统的显卡驱动并非是Nvidia驱动,需要先安装合适的Nvidia显卡驱动才能安装CUDA,去官网http://www.geforce.com/drivers查找显卡驱动型号。

《深度学习环境搭建:Ubuntu16.04+ python3.5+cuda8.0+Tensorflow1.4》
《深度学习环境搭建:Ubuntu16.04+ python3.5+cuda8.0+Tensorflow1.4》

最新的稳定版驱动为384,执行以下代码安装。

sudo add-apt-repository ppa:graphics-drivers/ppa

sudo apt-get update sudo apt-get install nvidia-384

sudo apt-get install mesa-common-dev

sudo apt-get install freeglut3-dev

执行完成后重启电脑,执行nvidia-smi查看驱动信息。

《深度学习环境搭建:Ubuntu16.04+ python3.5+cuda8.0+Tensorflow1.4》
《深度学习环境搭建:Ubuntu16.04+ python3.5+cuda8.0+Tensorflow1.4》

2.3 安装Cuda8.0

从NVIDIA官网https://developer.nvidia.com/cuda-release-candidate-download下载适合的CUDA版本,目前官网最新的版本是9.0,但是我非常不建议大家使用最新版本。

《深度学习环境搭建:Ubuntu16.04+ python3.5+cuda8.0+Tensorflow1.4》
《深度学习环境搭建:Ubuntu16.04+ python3.5+cuda8.0+Tensorflow1.4》

我们选择linux平台,下载runfile。执行;

sudo ./cuda_8.0.61_375.26_linux.run –tmpdir=/opt/temp/

这里加了–tmpdir主要是直接运行“sudo sh cuda_8.0.27_linux.run”会提示空间不足的错误,其实是全新的电脑主机,硬盘足够大的,google了以下发现加个tmpdir就可以了。

我们已经安装好了384,这一步选择n,剩下的一路yes就行。

《深度学习环境搭建:Ubuntu16.04+ python3.5+cuda8.0+Tensorflow1.4》
《深度学习环境搭建:Ubuntu16.04+ python3.5+cuda8.0+Tensorflow1.4》

最后需要配置环境变量,让我们安装的CUDA生效。

(1)打开sudo gedit ~/.bashrc,在最后面添加两行如下:

export PATH=/usr/local/cuda-8.0/bin${PATH:+:${PATH}}

export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

(2)设置环境变量和动态链接库,打开sudo gedit /etc/profile,在文件末尾加入:

export PATH=/usr/local/cuda/bin:$PATH

(3)创建链接文件,打开sudo gedit /etc/ld.so.conf.d/cuda.conf,在文件中添加:

/usr/local/cuda/lib64

最后执行 sudo ldconfig,使上述设置立即生效。

测试CUDA:

执行以下命令:

cd ~/NVIDIA_CUDA-8.0_Samples/1_Utilities/deviceQuery

make

./deviceQuery

可以看到详细信息,最后结果是Pass,则CUDA安装成功,否则就是哪里有问题(利用Google和百度解决)。

《深度学习环境搭建:Ubuntu16.04+ python3.5+cuda8.0+Tensorflow1.4》
《深度学习环境搭建:Ubuntu16.04+ python3.5+cuda8.0+Tensorflow1.4》

我这里result=pass,安装成功。

2.4 安装cuDNN6.0

在NIVIDA开发者官网上,找到cudnn的下载页面: https://developer.nvidia.com/rdp/cudnn-download ,选择”Download cuDNN v6.0 (April 27, 2017), for CUDA 8.0″ 中的 “cuDNN v6.0 Library for Linux”:

《深度学习环境搭建:Ubuntu16.04+ python3.5+cuda8.0+Tensorflow1.4》
《深度学习环境搭建:Ubuntu16.04+ python3.5+cuda8.0+Tensorflow1.4》

下载后安装非常简单,就是解压然后拷贝到相应的系统CUDA路径下,:

tar -zxvf cudnn-8.0-linux-x64-v6.0.tgz

sudo cp cuda/include/cudnn.h /usr/local/cuda/include/

sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/

sudo chmod a+r /usr/local/cuda/include/cudnn.h

sudo chmod a+r /usr/local/cuda/lib64/libcudnn*

2.5 安装Tensorflow1.4

Tensorflow的安装非常简单,我们先安装好了anaconda4.2(这个版本的python为3.5),修改好环境变量,然后用命令行安装就ok了:

sudo pip install –upgrade tensorflow

安装完成后,运行python,导入tensorflow包,一切正常的就是没有提示。

《深度学习环境搭建:Ubuntu16.04+ python3.5+cuda8.0+Tensorflow1.4》
《深度学习环境搭建:Ubuntu16.04+ python3.5+cuda8.0+Tensorflow1.4》

结束语:

在折腾过程中,不会一帆风顺,会有各种各样的坑等着你。不怕错误,善于利用百度、Google。如果有问题不好解决,可以留言,我会尽快回答。

当然,也欢迎关注微信公众号:Kaggle数据分析

参考资料:

1. http://www.52nlp.cn/深度学习主机配置-ubuntu16-04-geforce-gtx1080-tensorflow

2. http://blog.csdn.net/u010789558/article/details/51867648

3. http://blog.csdn.net/fei_6/article/details/75305692

    原文作者:王十二的
    原文地址: https://zhuanlan.zhihu.com/p/31430631
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞