Linux离线安装CUDA Toolkit & cuDNN | 核心步骤解析
离线环境下高效搭建GPU加速环境
在没有互联网连接的Linux环境中安装CUDA Toolkit和cuDNN是一项复杂但至关重要的任务。本文将详细指导您完成这一过程,确保您能顺利部署深度学习环境。
第一部:准备工作
离线安装需要提前准备相关的安装包和依赖文件:
- 确定系统版本(如Ubuntu 18.04)和CUDA版本(如CUDA 11.3)
- 在有网络的电脑上下载以下文件:
- NVIDIA-Linux-x86_64-*.run
- CUDA-Repo-- .deb
- libcudnn8_8.x.x-_amd64.deb
- libcudnn8-dev_8.x.x-_amd64.deb - 使用scp或U盘将所有文件传输到目标服务器
第二部:安装CUDA Toolkit
CUDA Toolkit的离线安装过程分为几个步骤:
chmod +x NVIDIA-Linux-x86_64-*.run
sudo ./NVIDIA-Linux-x86_64-*.run
# 按照提示安装,在分区选择时注意保留CUDA相关目录
# 添加CUDA仓库(如有必要)
sudo dpkg -i cuda-repo-ubuntu1804-x86_64_* .deb
sudo cp /var/cuda-repo-ubuntu1804-x86_64/cuda-*-keyring.gpg /usr/share/keyrings/
sudo apt-get update
sudo apt-get install cuda-11-3第三部:安装cuDNN
cuDNN的安装相对简单,主要是将预编译的DEB包安装到系统:
sudo dpkg -i libcudnn8_8.x.x-_amd64.deb
waitress
sudo dpkg -i libcudnn8-dev_8.x.x-_amd64.deb
# 验证安装
nvcc --version 第四部:环境验证与问题排查
安装完成后,建议进行以下验证:
- 检查CUDA版本:
nvidia-smi和nvcc --version - 确认深度学习框架(如TensorFlow、PyTorch)能正确识别CUDA设备
- 查看GPU使用情况:
gpustat常见问题解决:
- 依赖问题:sudo apt-get -f install
- 冲突版本:检查并卸载旧版CUDA包
- 权限问题:确保安装目录包含在PATH环境变量中
第五部:自动化脚本建议
为简化过程,可以创建一个安装脚本:
#!/bin/bash
# 安装依赖包
apt-get update && apt-get install -y build-essential linux-tools
# 安装CUDA
./install_cuda.sh
# 安装cuDNN
./install_cudnn.sh
# 配置环境变量
echo "export PATH=/usr/local/cuda-11.3/bin:$PATH" >> ~/.bashrc
source ~/.bashrc通过以上步骤,您已经成功在Linux离线环境中搭建了CUDA Toolkit和cuDNN环境,可以愉快地开始深度学习开发了!
文章版权声明:除非注明,否则均为V5主机测评网_性价比VPS_性价比云服务器_免费独立服务器原创文章,转载或复制请以超链接形式并注明出处。
