以Runfile的方式安装CUDA 11

在Ubuntu Server 20.04上安装CUDA 11。

以Runfile的方式安装CUDA 11

NVIDIA提供了两种CUDA安装方式。一种使用包管理器;另一种使用Runfile。这篇文章记录了以Runfile形式安装CUDA 11的过程。

环境信息

  • 操作系统:Ubuntu Server 20.04.4 LTS
  • 显卡:RTX 3090

准备工作

在正式开始前,请确认以下步骤。

确认GPU已正确安装

lspci | grep -i nvidia

输出类似:

01:00.0 VGA compatible controller: NVIDIA Corporation Device 2204 (rev a1)

清理环境

Runfile安装方式与包管理器安装方式冲突,所以需要卸载系统中已有的Nvidia组件。如果你确定系统中不包含类似组件,可以跳过此步。

sudo apt-get --purge remove "*cublas*" "*cufft*" "*curand*" \
 "*cusolver*" "*cusparse*" "*npp*" "*nvjpeg*" "cuda*" "nsight*" 
sudo apt-get --purge remove "*nvidia*"
sudo apt-get autoremove

确认GCC已安装

sudo apt install gcc, make

安装内核头文件

sudo apt-get install linux-headers-$(uname -r)

下载安装文件

我当前安装的CUDA版本为11.3。请根据实际安装版本替换。

wget https://developer.download.nvidia.com/compute/cuda/11.3.1/local_installers/cuda_11.3.1_465.19.01_linux.run

禁用社区驱动

使用如下命令,观察是否有任何输出。

lsmod | grep nouveau

如果有任何输出,则需要先禁用社区驱动。如果没有任何输出,跳过此步骤。

建立文件 /etc/modprobe.d/blacklist-nouveau.conf ,并在其中写入如下内容:

blacklist nouveau
options nouveau modeset=0

之后更新内核文件。

sudo update-initramfs -u

并重新启动计算机。

安装

准备工作完成后,正式开始安装。