记:第一次更新服务器CUDA和GPU驱动
? ? ? ? 因有需求需要改動(dòng)centos7中的CUDA(更新到10)和GUP 的driver(更新到410)的版本。
? ? ? ? 事先需要查看原版本的信息,使用nvidia-smi可以查看driver的版本信息(最新的也顯示CUDA的版本信息);使用nvcc –version查看CUDA的信息。
? ? ? ? 服務(wù)器的基本配置是:CUDA的原始版本是9.1.85,driver的原始版本是390.46,GPU的型號是Tesla P4,系統(tǒng)是centos7。(網(wǎng)上的教程說是先更新CUDA再更新driver,我也是按照上述步驟來的。)
? ? ? ? 首先,打開官網(wǎng),勾選配置(https://developer.nvidia.com/cuda-toolkit-archive)
圖1 CUDA的下載
? ? ? ? (PS:Installer Type的選擇沒有那么重要,每一個(gè)選擇都給出了相關(guān)的安裝步驟)
? ? ? ? 直接給定步驟安裝即可。對于CUDA,我選擇了直接覆蓋,所以在安裝完這個(gè)版本的時(shí)候系統(tǒng)中會(huì)存在兩個(gè)版本的CUDA,一個(gè)是CUDA9.1,一個(gè)是CUDA10.0。所以多版本需要配置環(huán)境,將CUDA10.0給添加到環(huán)境中。代碼如下:
####sudo vim ~/.bashrc
export PATH=$PATH:/usr/local/cuda-10.0/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-10.0/lib64/{LD_LIBRARY_PATH:+:{ LD_LIBRARY_PATH }}
export CUDA_HOME=/usr/local/cuda-10.0
#跳出
#####nvcc –version
? ? ? ? 這時(shí)候應(yīng)該輸出的CUDA的信息是你選定的,如果還是原版,建議####sudo reboot(不允許重啟,再想轍)
? ? ? ?更新完CUDA之后,接著可以更新driver,打開官網(wǎng):https://www.nvidia.com/Download/index.aspx?lang=cn,根據(jù)自己電腦的版本勾選信息,
圖2 GPU的driver的下載
? ? ? ? (PS:重要的事情說3遍,因?yàn)槲业南到y(tǒng)是centos7的,所以我選的“操作系統(tǒng)”是Linux 64-bit,如果選錯(cuò)了,之后會(huì)報(bào)錯(cuò))
? ? ? ? 我選的是后綴是.run的安裝包,使用的安裝命令如下:
####sudo sh ******************************.run
? ? ? ? (PS:安裝的過程我是選擇了先卸載,后安裝,據(jù)說直接覆蓋也是可以的)
? ? ? ? 安裝成功之后在命令行中輸入####nvidia-smi? ,有如下顯示,則表示CUDA和driver升級成功!
自己遇到的坑:
? ? ? ? 1、使用nvidia-detect 命令檢測,驅(qū)動(dòng)發(fā)現(xiàn)符合的驅(qū)動(dòng)版本是410.66,且不在yum中。對于不在yum中,我直接換了yum的環(huán)境,但是還是沒有,最好的方法是直接下載,使用sudo wget “******(下載的鏈接)******”? ??下載的地址是(以CUDA為例),選擇“下載按鍵”后單擊右鍵,選擇“復(fù)制鏈接地址”,這樣即找到了下載的鏈接。
? ? ? ? nvidia-detec推薦的是410.66的,官網(wǎng)上不一定有,一切以官網(wǎng)的為主。
? ? ? ? 2、???? 在GPU的驅(qū)動(dòng)下載過程中,將操作系統(tǒng)(自己的操作系統(tǒng)是centos7)錯(cuò)誤的選擇了Linux 64-bit RHEL7(正確的應(yīng)該是Linux 64-bit)。對于這個(gè)驅(qū)動(dòng),也是可以安裝的,但是CUDA和驅(qū)動(dòng)的版本并不匹配,所以使用####nvidia-smi命令會(huì)有如下的報(bào)錯(cuò):
? ? ? ? 這樣就不得不重新下載正確版本的driver,重新安裝后才正確運(yùn)行。
?
轉(zhuǎn)載于:https://www.cnblogs.com/cxf-zzj/p/9888389.html
總結(jié)
以上是生活随笔為你收集整理的记:第一次更新服务器CUDA和GPU驱动的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。