本篇文章主要是为了更新一下操作流程,前面我使用的tensorflow2.3 + cuda10.2 + cuDNN10.2挺稳定的使用,大家也可以保持这个最稳定版本搭配
一、首先我们看看tensorflow官方的硬件要求和软件要求
https://tensorflow.google.cn/install/gpu#software_requirements
显然官方是推荐我们使用Nvidia的显卡作为我们的加速卡,作者本人使用的显卡是19年买来学习tensorflow的RTX2070【感叹这块显卡比买的时候还贵了两千】
二、查看tensorflow_gpu版本对应的python版本、cuDNN版本、CUDA版本
https://tensorflow.google.cn/install/source_windows?hl=cn#gpu
这一步有助于你准备对应版本的安装包进行操作,这里我们选择了tensorflow_gpu2.4.1【目前stable最新版】和cuDNN8.X和CUDA11.X
这里我不打算使用臃肿的Anaconda,而是python3.8.9纯净版的环境,根据自己的需求安装即可
最后安装完成后使用pip freeze > requirements.txt保存库环境即可
三、安装环境跳转链接【需要登录Nvidia开发者账号】
Nvidia显卡驱动【选择你的显卡型号,Windows 10环境】:https://www.nvidia.cn/Download/index.aspx?lang=cn
CUDA11.X: https://developer.nvidia.com/zh-cn/cuda-downloads
cuDNN8.1.1: https://developer.nvidia.com/rdp/cudnn-download
python3.8.9: https://www.python.org/downloads/release/python-389/
由于CUDA和cuDNN需要用Nvidia开发者账号登录后进行下载,为了大家学习方便,文章最后会放上链接供大家下载安装文件
四、安装过程
1. 安装CUDA11.2 Toolkits
这里我自定义里面选择不安装显卡驱动,因为目前我的显卡驱动比它的还新【也可以保持兼容勾选】,点击下一步等待安装完成
2.安装cuDNN8.1.1
打开cudnn8.1.1的压缩包,可以看到cuda文件夹,里面包含bin/ include/ lib/ 三个文件夹
把bin/ include/ lib/ 三个文件夹复制到CUDA的版本号文件夹内,这样就算完成cuDNN的部署
3、测试nvidia-smi指令是否成功
可以看到指令运行成功,CUDA toolkits可以正常识别到我们的独立显卡信息
4、安装Python3.8.9【默认下一步安装即可,也可以指定你的PATH进行安装】
安装完成后记得更换python源会让国内的下载更快一些,避免各种超时操作
【pip.ini】文件把原来的安装源替换成这个阿里云
-
[global]
-
index-url = http://mirrors.aliyun.com/pypi/simple/
-
[install]
-
trusted-host = mirrors.aliyun.com
5、安装tensorflow_gpu 2.4.1
输入以下指令进行tensorflow_gpu进行安装
pip install tensorflow_gpu==2.4.1
安装完成的截图
6、安装Numpy
pip install numpy
7、Python shell测试tensorflow和CUDA的安装情况
首先打开终端,输入python后进入shell
输入以下代码进行测试:
-
import tensorflow
as tf
-
tf.config.list_physical_devices(
'GPU')
可以看到上面报了一个动态链接库找不到的故障,具体是找不到cusolver64_10.dll这个动态链接库:
2021-04-19 00:04:11.634299: W tensorflow/stream_executor/platform/default/dso_loader.cc:60] Could not load dynamic library 'cusolver64_10.dll'; dlerror: cusolver64_10.dll not found
8、处理cusolver64_10.dll找不到的error
https://github.com/tensorflow/tensorflow/issues/44291
在这个上面的issues里面,有两种处理办法,这里我就简单两句话带一下
(1)将原来自带的cusolver64_11.dll复制一份, 重命名为 cusolver64_10.dll
(2)从CUDA10.2里面拷一个cusolver64_10.dll过来这边使用
我们再试一次python shell的测试:
-
import tensorflow
as tf
-
tf.config.list_physical_devices(
'GPU')
很好,没有报错,运行加载很顺畅,到此本篇由【CSDN-Archer阿茶】写的教程就到这里结束了。
五、安装包学习共享链接,不会保持一直更新
TFCUDA下载地址..txt : http://file.fmapp.com/s/vfex8bvx
注:经常有偷CSDN文章的爬虫垃圾网站,这里就不直接公布百度网盘的地址避免被白嫖链接
转载:https://blog.csdn.net/sinat_28494049/article/details/115842133