CUDA、tensorflow与cuDNN的版本匹配问题

一、问题现象

CUDAtensorflow cuDNN有版本匹配的问题,经常出现安装了某一版本的 CUDA 后,tensorflow 不支持相应版本的CUDA,或者tensorflow 支持 CUDA,但与 cuDNN版本不匹配,找不到这个那个文件,网上甚至有 CUDA装错等于重装的说法,很是麻烦。

这里列举了一些我遇到过的错误(有的没有装cuDNN

 

CUDA9.2 + 1.8版本tensorflow

ImportError: libcudnn.so.7: cannot open shared objectfile: No such file or directory

CUDA9.2 +1.7版本tensorflow

ImportError: libcublas.so.9.0: cannot open shared objectfile: No such file or directory

CUDA9.2 +1.6版本tensorflow

ImportError: libcublas.so.9.0: cannot open shared objectfile: No such file or directory

CUDA9.2 +1.5版本tensorflow

ImportError: libcublas.so.9.0: cannot open shared objectfile: No such file or directory

CUDA9.2 +1.3版本tensorflow

ImportError: libcusolver.so.8.0: cannot open sharedobject file: No such file or directory

 

DUDA9.0+ 1.8版本tensorflow

ImportError: libcudnn.so.7: cannot open shared objectfile: No such file or directory

 

CUDA 8.0+ 1.8版本tensorflow 

ImportError: libcudnn.so.6: cannot open shared objectfile: No such file or directory

CUDA 8.0+ 1.8版本tensorflow

ImportError: libcublas.so.9.0: cannot open shared objectfile: No such file or directory

CUDA 8.0+ 1.7版本tensorflow

ImportError: libcublas.so.9.0: cannot open shared objectfile: No such file or directory

CUDA 8.0+ 1.6版本tensorflow

ImportError: libcublas.so.9.0: cannot open shared objectfile: No such file or directory

CUDA 8.0+ 1.5版本tensorflow

ImportError: libcublas.so.9.0: cannot open shared objectfile: No such file or directory

 

二、问题分析

大概总结了一下,以上错误有两种类型

1libcudnn.so.x 找不到的情况:没有装 cuDNN

2libcublas.so.x 找不到的情况:版本不匹配, CUDA cuDNN 或者tensorflow 版本不匹配,等等

 

三、解决办法:

根据现象和一些实际的验证操作,大概总结出以下安装方法比较靠谱,但由于时间关系没有作全系列的组合验证,可以作为参考:

3.1 安装顺序

先安装 CUDA,再安装 tensorflow ,最后安装 cuDNN,严格按照这个顺序装,可以避免返工,避免一步错就必须重装系统

 

3.2 安装配置

参照我的另一篇文章《Ubuntu 16.04+1080Ti机器学习基本环境配置,安装以下软件

A、先安装 CUDA,注意不要选择最新的 9.2 版本,因为 tensorflow 还不支持这个最新的版本,我们选择 9.0 版本的就好,

B、安装tensorflow,同样参考上述文章,注意要先配置 pip源 。这里我们默认下载的最新版本是 1.8 版本的。

C、最后安装 cuDNN

 

四、验证

4.1、确定大版本

根据提示的错误信息,例如提示找不到 libcudnn.so.x 或者 libcublas.so.x,那么这个x代表的数字信息就是我们要安装的 cuDNN 的版本,

4.2、确定大版本下的CUDA版本

https://developer.nvidia.com/rdp/cudnn-download下载对应的版本,先看上面说的大版本,再看对应的CUDA 版本,例如找不到libcudnn.so.7,则安装 v7 大版本的 cuDNN,而我们已经安装的CUDA版本是 CUDA9.0,所以我们应该下载v7 大版本下对应的 CUDA9.0版本,即DownloadcuDNN v7.1.4 (May 16, 2018), for CUDA 9.0版本,

4.3、下载文件

下载其下的cuDNN v7.1.4 Library for Linux

安装完成后,验证方法参照上述提到的文章

如此一般可以解决问题

 

尊重劳动成果,转载请注明出处,本文链接:https://blog.csdn.net/MahoneSun/article/details/80809042

    原文作者:括号匹配问题
    原文地址: https://blog.csdn.net/MahoneSun/article/details/80809042
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞