我注意到一些较新的TensorFlow版本与较旧的CUDA和cuDNN版本不兼容。是否存在兼容版本的概述,甚至官方测试的组合列表?我在TensorFlow文档中找不到它。
当前回答
tensorflow站点中给出的兼容性表不包含cuda和cuDNN的特定小版本。但是,如果不满足特定的版本,在尝试使用tensorflow时会出现错误。
对于tensorflow-gpu==1.12.0和cuda==9.0,兼容的cuDNN版本是7.1.4,注册后可以从这里下载。
你可以检查你的cuda版本使用 学校网站——版本
使用cuDNN版本 cat /usr/include/cudnn.h | grep CUDNN_MAJOR -A 2 .单击“确定”
使用Tensorflow-gpu版本 PIP freeze | grep tensorflow-gpu
更新: 由于tensorflow 2.0已经发布,我将分享它兼容的cuda和cuDNN版本(适用于Ubuntu 18.04)。
Tensorflow-gpu = 2.0.0 Cuda = 10.0 cuDNN = 7.6.0
其他回答
如果你在jupyter笔记本上编码,并且想要检查tf使用的cuda版本,直接在jupyter单元中运行以下命令:
!conda list cudatoolkit
!conda list cudnn
检查gpu对tf是否可见:
tf.test.is_gpu_available(
cuda_only=False, min_cuda_compute_capability=None
)
我错误地安装了CUDA 10.1和cudn7.6。您可以使用以下配置(这适用于我-截至9/10)。:
Tensorflow-gpu == 1.14.0 CUDA 10.1 CUDNN 7.6 Ubuntu 18.04
但是我必须为它创建符号链接,因为tensorflow最初与CUDA 10一起工作。
sudo ln -s /opt/cuda/targets/x86_64-linux/lib/libcublas.so /opt/cuda/targets/x86_64-linux/lib/libcublas.so.10.0
sudo cp /usr/lib/x86_64-linux-gnu/libcublas.so.10 /usr/local/cuda-10.1/lib64/
sudo ln -s /usr/local/cuda-10.1/lib64/libcublas.so.10 /usr/local/cuda-10.1/lib64/libcublas.so.10.0
sudo ln -s /usr/local/cuda/targets/x86_64-linux/lib/libcusolver.so.10 /usr/local/cuda/lib64/libcusolver.so.10.0
sudo ln -s /usr/local/cuda/targets/x86_64-linux/lib/libcurand.so.10 /usr/local/cuda/lib64/libcurand.so.10.0
sudo ln -s /usr/local/cuda/targets/x86_64-linux/lib/libcufft.so.10 /usr/local/cuda/lib64/libcufft.so.10.0
sudo ln -s /usr/local/cuda/targets/x86_64-linux/lib/libcudart.so /usr/local/cuda/lib64/libcudart.so.10.0
sudo ln -s /usr/local/cuda/targets/x86_64-linux/lib/libcusparse.so.10 /usr/local/cuda/lib64/libcusparse.so.10.0
并将以下内容添加到我的~/。bashrc, (
export PATH=/usr/local/cuda/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH
export PATH=/usr/local/cuda-10.1/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-10.1/lib64:$LD_LIBRARY_PATH
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/opt/cuda/targets/x86_64-linux/lib/
在升级到TF 2.0后,我遇到了类似的问题。TF报告的CUDA版本与Ubuntu 18.04认为我已经安装的版本不匹配。它说我使用的是CUDA 7.5.0,但apt认为我安装的版本是正确的。
我最终不得不做的是在/usr/local中递归地grep CUDNN_MAJOR,我发现/usr/local/cuda-10.0/target /x86_64-linux/include/cudnn.h确实将版本指定为7.5.0。 /usr/local/cuda-10.1是正确的,而/usr/local/cuda指向/usr/local/cuda-10.1,所以对我来说,为什么TF要查看/usr/local/cuda-10.0是一个谜。
不管怎样,我只是把/usr/local/cuda-10.0移动到/usr/local/old-cuda-10.0,所以TF再也找不到它了,然后一切都像魔法一样工作。
这一切都很令人沮丧,我仍然觉得我只是做了一次随机入侵。但它起作用了:)也许这将帮助那些有类似问题的人。
谢谢你的第一个回答。
关于向后兼容性。
我可以用cuda-11.1和cudn 8.0.5成功安装tensorflow-2.4.0。
来源:https://www.tensorflow.org/install/source gpu
tensorflow站点中给出的兼容性表不包含cuda和cuDNN的特定小版本。但是,如果不满足特定的版本,在尝试使用tensorflow时会出现错误。
对于tensorflow-gpu==1.12.0和cuda==9.0,兼容的cuDNN版本是7.1.4,注册后可以从这里下载。
你可以检查你的cuda版本使用 学校网站——版本
使用cuDNN版本 cat /usr/include/cudnn.h | grep CUDNN_MAJOR -A 2 .单击“确定”
使用Tensorflow-gpu版本 PIP freeze | grep tensorflow-gpu
更新: 由于tensorflow 2.0已经发布,我将分享它兼容的cuda和cuDNN版本(适用于Ubuntu 18.04)。
Tensorflow-gpu = 2.0.0 Cuda = 10.0 cuDNN = 7.6.0
推荐文章
- 如何在使用新语言特性的程序中检查Python版本?
- nvcc和NVIDIA-smi显示的不同CUDA版本
- 无法安装包由于一个环境错误:[WinError 5]访问被拒绝:
- 我的iphone应用程序如何检测自己的版本号?
- 如何检查CocoaPods框架的版本
- 检查Redis服务器版本
- 我想从Java日期中获得年,月,日等,以与Java中的公历日期进行比较。这可能吗?
- 如何检查Gradle依赖是否有新版本?
- Android Manifest中的versionCode vs versionName
- 使用CUDA运行时API检查错误的规范方法是什么?
- 在tensorflow中,名称作用域和变量作用域有什么区别?
- 哪些TensorFlow和CUDA版本组合是兼容的?
- 如何在TensorFlow中打印一个张量对象的值?
- 在Tensorflow中转换张量到numpy数组?
- 如何用SSE4.2和AVX指令编译Tensorflow ?