是否有任何快速命令或脚本来检查安装的CUDA版本?

我在安装目录下找到了4.0的手册,但我不确定它是否是实际安装的版本。


当前回答

除了上面提到的那些,CUDA安装路径(如果在安装过程中没有更改)通常包含版本号

执行哪个nvcc应该提供路径,这将为您提供版本

PS:这是一种快速而肮脏的方式,上面的答案更优雅,并将通过相当大的努力产生正确的版本

其他回答

使用以下命令检查Conda的CUDA安装:

conda list cudatoolkit

使用以下命令检查conda安装的CUDNN版本:

conda list cudnn

如果要通过CONDA安装/更新CUDA和CUDNN,请使用以下命令:

conda install -c anaconda cudatoolkit
conda install -c anaconda cudnn

或者,您可以使用以下命令检查CUDA安装:

nvidia-smi

OR

nvcc --version

如果您正在通过Anaconda包使用tensorflow-gpu(只需在控制台中打开Python,检查默认的Python在启动时是否显示Anaconda-Inc.,或者您可以运行哪个Python并检查位置),那么手动安装CUDA和CUDNN很可能无法工作。您将不得不通过conda进行更新。

如果您想手动安装CUDA、CUDNN或tensorflow gpu,可以查看此处的说明https://www.tensorflow.org/install/gpu

除了上面提到的那些,CUDA安装路径(如果在安装过程中没有更改)通常包含版本号

执行哪个nvcc应该提供路径,这将为您提供版本

PS:这是一种快速而肮脏的方式,上面的答案更优雅,并将通过相当大的努力产生正确的版本

其他受访者已经描述了可以使用哪些命令检查CUDA版本。在这里,我将描述如何将这些命令的输出转换为格式为“10.2”、“11.0”等的环境变量。

概括一下,您可以使用

nvcc --version

了解CUDA版本。我想这应该是你的第一个停靠港。如果安装了多个版本的CUDA,此命令应打印出PATH中最高的副本版本。

输出如下所示:

nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2020 NVIDIA Corporation
Built on Thu_Jun_11_22:26:38_PDT_2020
Cuda compilation tools, release 11.0, V11.0.194
Build cuda_11.0_bu.TC445_37.28540450_0

我们可以将这个输出传递给sed,以便只选择MAJOR.MINOR发布版本号。

CUDA_VERSION=$(nvcc --version | sed -n 's/^.*release \([0-9]\+\.[0-9]\+\).*$/\1/p')

如果nvcc不在您的路径上,您应该能够通过指定nvcc默认位置的完整路径来运行它。

/usr/local/cuda/bin/nvcc --version

其输出与上述相同,并且可以以相同的方式对其进行解析。

或者,您可以从version.txt文件中找到CUDA版本。

cat /usr/local/cuda/version.txt

其输出

CUDA Version 10.1.243

可以使用sed进行解析,以仅选择MAJOR.MINOR发布版本号。

CUDA_VERSION=$(cat /usr/local/cuda/version.txt | sed 's/.* \([0-9]\+\.[0-9]\+\).*/\1/')

请注意,有时version.txt文件引用的CUDA安装不同于nvcc--version。在这种情况下,nvcc版本应该是您实际使用的版本。

我们可以将这三种方法结合在一起,以稳健地获得CUDA版本,如下所示:

if nvcc --version 2&> /dev/null; then
    # Determine CUDA version using default nvcc binary
    CUDA_VERSION=$(nvcc --version | sed -n 's/^.*release \([0-9]\+\.[0-9]\+\).*$/\1/p');

elif /usr/local/cuda/bin/nvcc --version 2&> /dev/null; then
    # Determine CUDA version using /usr/local/cuda/bin/nvcc binary
    CUDA_VERSION=$(/usr/local/cuda/bin/nvcc --version | sed -n 's/^.*release \([0-9]\+\.[0-9]\+\).*$/\1/p');

elif [ -f "/usr/local/cuda/version.txt" ]; then
    # Determine CUDA version using /usr/local/cuda/version.txt file
    CUDA_VERSION=$(cat /usr/local/cuda/version.txt | sed 's/.* \([0-9]\+\.[0-9]\+\).*/\1/')

else
    CUDA_VERSION=""

fi

此环境变量对于下游安装非常有用,例如当pip安装为正确CUDA版本编译的pytorch副本时。

python -m pip install \
    "torch==1.9.0+cu${CUDA_VERSION/./}" \
    "torchvision==0.10.0+cu${CUDA_VERSION/./}" \
    -f https://download.pytorch.org/whl/torch_stable.html

同样,当未安装CUDA时,可以安装CPU版本的pytorch。

if [ "$CUDA_VERSION" = "" ]; then
    MOD="+cpu";
    echo "Warning: Installing CPU-only version of pytorch"
else
    MOD="+cu${CUDA_VERSION/./}";
    echo "Installing pytorch with $MOD"
fi

python -m pip install \
    "torch==1.9.0${MOD}" \
    "torchvision==0.10.0${MOD}" \
    -f https://download.pytorch.org/whl/torch_stable.html

但要小心这一点,因为当您打算使用GPU支持时,可能会意外安装仅CPU版本。例如,如果您在没有GPU的服务器登录节点上运行安装脚本,那么您的作业将部署到有GPU的节点上。在这种情况下,登录节点通常不会安装CUDA。

在Ubuntu Cuda V8上:

$ cat /usr/local/cuda/version.txt
  

您还可以了解CUDA版本的安装情况:

$ ls -l /usr/local | grep cuda

这会给你这样的东西:

lrwxrwxrwx  1 root root    9 Mar  5  2020 cuda -> cuda-10.2
drwxr-xr-x 16 root root 4096 Mar  5  2020 cuda-10.2
drwxr-xr-x 16 root root 4096 Mar  5  2020 cuda-8.0.61

给定一个正常的PATH,cuda指向的版本应该是活动版本(本例中为10.2)。

注意:只有当您愿意假设CUDA安装在/usr/local/CUDA下时,这才有效(这对于具有默认位置的独立安装程序是正确的,但对于CUDA集成为软件包的发行版则不正确)。参考:@einpoklum的评论。

通过在终端中键入以下内容,可以获得cuda版本:

$ nvcc -V

# below is the result
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2017 NVIDIA Corporation
Built on Fri_Nov__3_21:07:56_CDT_2017
Cuda compilation tools, release 9.1, V9.1.85

或者,可以先使用以下方法查找安装目录,手动检查版本:

$ whereis -b cuda         
cuda: /usr/local/cuda

然后cd到该目录并检查CUDA版本。