是否有任何快速命令或脚本来检查安装的CUDA版本?
我在安装目录下找到了4.0的手册,但我不确定它是否是实际安装的版本。
是否有任何快速命令或脚本来检查安装的CUDA版本?
我在安装目录下找到了4.0的手册,但我不确定它是否是实际安装的版本。
当前回答
除了上面提到的那些,CUDA安装路径(如果在安装过程中没有更改)通常包含版本号
执行哪个nvcc应该提供路径,这将为您提供版本
PS:这是一种快速而肮脏的方式,上面的答案更优雅,并将通过相当大的努力产生正确的版本
其他回答
您可以使用
nvcc -V
或者你可以使用
nvcc --version
或者您可以检查CUDA使用的位置
whereis cuda
然后做
cat location/of/cuda/you/got/from/above/command
其他受访者已经描述了可以使用哪些命令检查CUDA版本。在这里,我将描述如何将这些命令的输出转换为格式为“10.2”、“11.0”等的环境变量。
概括一下,您可以使用
nvcc --version
了解CUDA版本。我想这应该是你的第一个停靠港。如果安装了多个版本的CUDA,此命令应打印出PATH中最高的副本版本。
输出如下所示:
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2020 NVIDIA Corporation
Built on Thu_Jun_11_22:26:38_PDT_2020
Cuda compilation tools, release 11.0, V11.0.194
Build cuda_11.0_bu.TC445_37.28540450_0
我们可以将这个输出传递给sed,以便只选择MAJOR.MINOR发布版本号。
CUDA_VERSION=$(nvcc --version | sed -n 's/^.*release \([0-9]\+\.[0-9]\+\).*$/\1/p')
如果nvcc不在您的路径上,您应该能够通过指定nvcc默认位置的完整路径来运行它。
/usr/local/cuda/bin/nvcc --version
其输出与上述相同,并且可以以相同的方式对其进行解析。
或者,您可以从version.txt文件中找到CUDA版本。
cat /usr/local/cuda/version.txt
其输出
CUDA Version 10.1.243
可以使用sed进行解析,以仅选择MAJOR.MINOR发布版本号。
CUDA_VERSION=$(cat /usr/local/cuda/version.txt | sed 's/.* \([0-9]\+\.[0-9]\+\).*/\1/')
请注意,有时version.txt文件引用的CUDA安装不同于nvcc--version。在这种情况下,nvcc版本应该是您实际使用的版本。
我们可以将这三种方法结合在一起,以稳健地获得CUDA版本,如下所示:
if nvcc --version 2&> /dev/null; then
# Determine CUDA version using default nvcc binary
CUDA_VERSION=$(nvcc --version | sed -n 's/^.*release \([0-9]\+\.[0-9]\+\).*$/\1/p');
elif /usr/local/cuda/bin/nvcc --version 2&> /dev/null; then
# Determine CUDA version using /usr/local/cuda/bin/nvcc binary
CUDA_VERSION=$(/usr/local/cuda/bin/nvcc --version | sed -n 's/^.*release \([0-9]\+\.[0-9]\+\).*$/\1/p');
elif [ -f "/usr/local/cuda/version.txt" ]; then
# Determine CUDA version using /usr/local/cuda/version.txt file
CUDA_VERSION=$(cat /usr/local/cuda/version.txt | sed 's/.* \([0-9]\+\.[0-9]\+\).*/\1/')
else
CUDA_VERSION=""
fi
此环境变量对于下游安装非常有用,例如当pip安装为正确CUDA版本编译的pytorch副本时。
python -m pip install \
"torch==1.9.0+cu${CUDA_VERSION/./}" \
"torchvision==0.10.0+cu${CUDA_VERSION/./}" \
-f https://download.pytorch.org/whl/torch_stable.html
同样,当未安装CUDA时,可以安装CPU版本的pytorch。
if [ "$CUDA_VERSION" = "" ]; then
MOD="+cpu";
echo "Warning: Installing CPU-only version of pytorch"
else
MOD="+cu${CUDA_VERSION/./}";
echo "Installing pytorch with $MOD"
fi
python -m pip install \
"torch==1.9.0${MOD}" \
"torchvision==0.10.0${MOD}" \
-f https://download.pytorch.org/whl/torch_stable.html
但要小心这一点,因为当您打算使用GPU支持时,可能会意外安装仅CPU版本。例如,如果您在没有GPU的服务器登录节点上运行安装脚本,那么您的作业将部署到有GPU的节点上。在这种情况下,登录节点通常不会安装CUDA。
使用CUDA运行时API C++包装器编程(注意:我是作者):
auto v1 = cuda::version::maximum_supported_by_driver();
auto v2 = cuda::version::runtime();
这为您提供了一个cuda::version_t结构,您可以对其进行比较,也可以打印/流式传输,例如:
if (v2 < cuda::version_t{ 8, 0 } ) {
std::cerr << "CUDA version " << v2 << " is insufficient." std::endl;
}
如果nvcc和nvidia-smi之间存在版本不匹配,则使用不同版本的cuda作为驱动程序和运行时环境。
为了确保使用相同版本的CUDA驱动程序,您需要做的是在系统路径上获取CUDA。
首先运行cuda所在的位置,找到cuda驱动程序的位置。
然后转到.bashrc并修改路径变量,并使用变量“LD_LIBRARY_path”设置搜索的目录优先顺序。
例如
$ whereis cuda
cuda: /usr/lib/cuda /usr/include/cuda.h /usr/local/cuda
CUDA安装在/usr/local/CUDA,现在我们需要将路径变量添加到.bashrc,如下所示:
vim ~/.bashrc
export PATH="/usr/local/cuda/bin:${PATH}"
在该行之后,将目录搜索路径设置为:
export LD_LIBRARY_PATH="/usr/local/cuda/lib64:${LD_LIBRARY_PATH}"
然后保存.bashrc文件。并将其刷新为:
$ source ~/.bashrc
这将确保您有nvcc-V和nvidia-smi使用相同版本的驱动程序。
在以下时间之后找到我的:
whereis cuda
at
cuda:/usr/lib/cuda/usr/include/cuda.h
with
nvcc --version
CUDA版本9.1.85