环境配置(重要)

重要提醒:

  1. 请勿在虚拟机内安装显卡驱动,如需重新安装CUDA,请在安装过程中禁止显卡驱动安装;

  2. 已经配置conda及常用深度学习环境;

  3. 如果需要安装CUDA,优先使用conda安装;

  4. 如需容器迁移联系管理员。

版本兼容性

Linux内核 -> NVIDIA驱动 -> CUDA -> PyTorch

以上是版本依赖链,你可以更改CUDA和CUDA之上的软件版本,其他版本更新请联系管理员。

例如,NVIDIA驱动版本为410(可以通过nvidia-smi查看),最高支持的CUDA版本是10.0,那么9.0、8.0、7.0的版本也会被向后兼容,但更新的10.2、11.0等版本就无法支持了,无论是通过conda还是apt安装。

对于PyTorch等更上层的包,官方最新版本的安装命令可能是如下的,指定了cudatoolkit版本10.1

conda install pytorch==1.5.0 torchvision==0.6.0 cudatoolkit=10.1 -c pytorch

但实际上也可以兼容CUDA10.0。当我们的驱动版本最高支持到CUDA10的时候,可以更改命令为

conda install pytorch==1.5.0 torchvision==0.6.0 cudatoolkit=10.0 -c pytorch

再次强调,不要在容器内安装驱动程序,否则兼容问题将导致驱动失效。