Linux离线安装CUDA Toolkit & cuDNN | 核心步骤解析 - 服务器技术

Linux离线安装CUDA Toolkit & cuDNN | 核心步骤解析

离线环境下高效搭建GPU加速环境

在没有互联网连接的Linux环境中安装CUDA Toolkit和cuDNN是一项复杂但至关重要的任务。本文将详细指导您完成这一过程，确保您能顺利部署深度学习环境。

第一部：准备工作

离线安装需要提前准备相关的安装包和依赖文件：

确定系统版本（如Ubuntu 18.04）和CUDA版本（如CUDA 11.3）
在有网络的电脑上下载以下文件：
- NVIDIA-Linux-x86_64-*.run
- CUDA-Repo--.deb
- libcudnn8_8.x.x-_amd64.deb
- libcudnn8-dev_8.x.x-_amd64.deb
使用scp或U盘将所有文件传输到目标服务器

第二部：安装CUDA Toolkit

CUDA Toolkit的离线安装过程分为几个步骤：

chmod +x NVIDIA-Linux-x86_64-*.run
sudo ./NVIDIA-Linux-x86_64-*.run
# 按照提示安装，在分区选择时注意保留CUDA相关目录

# 添加CUDA仓库（如有必要）
sudo dpkg -i cuda-repo-ubuntu1804-x86_64_* .deb
sudo cp /var/cuda-repo-ubuntu1804-x86_64/cuda-*-keyring.gpg /usr/share/keyrings/
sudo apt-get update
sudo apt-get install cuda-11-3

第三部：安装cuDNN

cuDNN的安装相对简单，主要是将预编译的DEB包安装到系统：

sudo dpkg -i libcudnn8_8.x.x-_amd64.deb
waitress
sudo dpkg -i libcudnn8-dev_8.x.x-_amd64.deb

# 验证安装
nvcc --version

第四部：环境验证与问题排查

安装完成后，建议进行以下验证：

检查CUDA版本：nvidia-smi和nvcc --version
确认深度学习框架（如TensorFlow、PyTorch）能正确识别CUDA设备
查看GPU使用情况：gpustat
常见问题解决：
- 依赖问题：sudo apt-get -f install
- 冲突版本：检查并卸载旧版CUDA包
- 权限问题：确保安装目录包含在PATH环境变量中
第五部：自动化脚本建议
为简化过程，可以创建一个安装脚本：
```
#!/bin/bash
# 安装依赖包
apt-get update && apt-get install -y build-essential linux-tools

# 安装CUDA
./install_cuda.sh

# 安装cuDNN
./install_cudnn.sh

# 配置环境变量
echo "export PATH=/usr/local/cuda-11.3/bin:$PATH" >> ~/.bashrc
source ~/.bashrc
```
通过以上步骤，您已经成功在Linux离线环境中搭建了CUDA Toolkit和cuDNN环境，可以愉快地开始深度学习开发了！

V5主机测评网_性价比VPS_性价比云服务器_免费独立服务器

Linux离线安装CUDA Toolkit & cuDNN | 核心步骤解析

Linux离线安装CUDA Toolkit & cuDNN | 核心步骤解析

离线环境下高效搭建GPU加速环境

第一部：准备工作

第二部：安装CUDA Toolkit

第三部：安装cuDNN

第四部：环境验证与问题排查

第五部：自动化脚本建议

相关阅读