Linux离线安装CUDA Toolkit & cuDNN | 核心步骤解析

V5主机测评

Linux离线安装CUDA Toolkit & cuDNN | 核心步骤解析

离线环境下高效搭建GPU加速环境

在没有互联网连接的Linux环境中安装CUDA Toolkit和cuDNN是一项复杂但至关重要的任务。本文将详细指导您完成这一过程,确保您能顺利部署深度学习环境。

Linux离线安装环境示意图

第一部:准备工作

离线安装需要提前准备相关的安装包和依赖文件:

  1. 确定系统版本(如Ubuntu 18.04)和CUDA版本(如CUDA 11.3)
  2. 在有网络的电脑上下载以下文件:
    - NVIDIA-Linux-x86_64-*.run
    - CUDA-Repo--.deb
    - libcudnn8_8.x.x-_amd64.deb
    - libcudnn8-dev_8.x.x-_amd64.deb
  3. 使用scp或U盘将所有文件传输到目标服务器

第二部:安装CUDA Toolkit

CUDA Toolkit的离线安装过程分为几个步骤:

chmod +x NVIDIA-Linux-x86_64-*.run
sudo ./NVIDIA-Linux-x86_64-*.run
# 按照提示安装,在分区选择时注意保留CUDA相关目录

# 添加CUDA仓库(如有必要)
sudo dpkg -i cuda-repo-ubuntu1804-x86_64_* .deb
sudo cp /var/cuda-repo-ubuntu1804-x86_64/cuda-*-keyring.gpg /usr/share/keyrings/
sudo apt-get update
sudo apt-get install cuda-11-3

第三部:安装cuDNN

cuDNN的安装相对简单,主要是将预编译的DEB包安装到系统:

sudo dpkg -i libcudnn8_8.x.x-_amd64.deb
waitress
sudo dpkg -i libcudnn8-dev_8.x.x-_amd64.deb

# 验证安装
nvcc --version

第四部:环境验证与问题排查

安装完成后,建议进行以下验证:

  1. 检查CUDA版本:nvidia-sminvcc --version
  2. 确认深度学习框架(如TensorFlow、PyTorch)能正确识别CUDA设备
  3. 查看GPU使用情况:gpustat

    常见问题解决:

    • 依赖问题:sudo apt-get -f install
    • 冲突版本:检查并卸载旧版CUDA包
    • 权限问题:确保安装目录包含在PATH环境变量中

    第五部:自动化脚本建议

    为简化过程,可以创建一个安装脚本:

    #!/bin/bash
    # 安装依赖包
    apt-get update && apt-get install -y build-essential linux-tools

    # 安装CUDA
    ./install_cuda.sh

    # 安装cuDNN
    ./install_cudnn.sh

    # 配置环境变量
    echo "export PATH=/usr/local/cuda-11.3/bin:$PATH" >> ~/.bashrc
    source ~/.bashrc

    通过以上步骤,您已经成功在Linux离线环境中搭建了CUDA Toolkit和cuDNN环境,可以愉快地开始深度学习开发了!

文章版权声明:除非注明,否则均为V5主机测评网_性价比VPS_性价比云服务器_免费独立服务器原创文章,转载或复制请以超链接形式并注明出处。