Windows 10 安装使用TensorFlow-GPU
Windows 10 安裝使用TensorFlow-GPU
?
當前環(huán)境描述:Win10 64位,Python3.6
目標:安裝使用TensorFlow1.6-GPU
所需文件:Cuda9.0、Cudnn7.0
注意:安裝Cuda9.1 & Cudnn7.1的環(huán)境下將不能正常使用TF1.6-GPU
?
Tensorflow 官網(wǎng)安裝描述如下:
網(wǎng)址:https://tensorflow.google.cn/install/install_windows
?
?
?
步驟:
1、下載安裝Cuda9.0
網(wǎng)址:https://developer.nvidia.com/cuda-90-download-archive?target_os=Windows&target_arch=x86_64&target_version=10
注意:搜索CUDA進入下載界面默認下載最新的9.1版本,
步驟:搜索cuda9,進入后點擊下載,下載完成直接安裝即可
?
?
2、下載安裝Cudnn7.0、添加進path
網(wǎng)址:https://developer.nvidia.com/rdp/cudnn-download
注意:下載Cudnn會需要注冊,并且完成問卷調(diào)查
步驟:下載完成后為安裝包形式,解壓后為復制到cuda9.0的路徑
Cuda9.0默認路徑為:C:\Program?Files\NVIDIA?GPU?Computing?Toolkit\CUDA\v9.0
?
3、安裝TF1.6-GPU
步驟:直接pip install --upgradetensorflow-gpu
?
4、驗證測試
安裝好后打開python,
引用tensorflow,新建一個常量,再打印出來
語句如下:
import?tensorflow?as?tf
hello?=?tf.constant('Hello,?TensorFlow!')
sess?=?tf.Session()
print(sess.run(hello))
?
若安裝成功則會再運行sess?=?tf.Session()的時候出現(xiàn)自己的GPU型號等信息
截圖如下:
?
?
?
?
如果不能正常使用:
1、檢查所有的版本是否正確,當前版本 win10 64位、python3.6、cuda9.0、cudnn7.0、tensorflow1.6-gpu
2、確認cuda的環(huán)境變量已經(jīng)添加、如果還是不行再將cudnn解壓后的cudnn/bin路徑添加到環(huán)境變量
?
cuda 9.0 + vs2015 環(huán)境搭建
2017年11月06日 15:29:01 閱讀數(shù):8075 cuda 9.0 + vs2015 總結(jié):搭建還算順利,全自動,沒毛病 系統(tǒng)硬件屬性: win7 64位 + GTX960 +內(nèi)存16G先下載安裝vs2015,當然vs2017也是可以的,cuda9.0支持2017 cuda 9.0 下載地址: https://developer.nvidia.com/cuda-downloads 我配置如下:
點擊下載本地版。
下載結(jié)束后,點擊exe運行安裝:
路徑自己定義,這邊我制定到我自己的E盤 ,解壓的時候出現(xiàn)無法創(chuàng)建 d3dcompiler_47.dll的文件,我就重新安裝到D盤,就沒事了,具體不知道什么原因,這里記錄一下。
下面可以選擇精簡也可以自定義安裝,需要幾分鐘時間,一般不會有什么問題。
安裝結(jié)束后會有一個提示框,勾選那三項,會直接運行安裝好的程序和顯示cuda vs的sample。
點擊2015vs 的sln工程文件,會初始化打開cuda vs sample工程,打開這個工程自己手動build一下,正常情況下不會有問題,直接生成exe,如果有問題看一下項目屬性后需要配置一個屬性,右鍵點擊工程屬性:
cuda目錄要最終選擇到版本號這個文件,比如我是C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0
點擊應(yīng)用,確定,然后開始build 這個項目,編譯成功。我隨便選了一個gl的項目
這邊另外配置一點可以高亮cu文件和去掉提示錯誤的一個方法: 設(shè)置方法:?在VS2010的菜單?依次點擊:“Tools|Options…|Text Editor|File Extension”,在這個 界面 里:?“Editor” 下拉框 選“Microsoft Visual C++”,在“Extension”文本框 輸入 .cu?點擊“Add”按鈕?,重復工作把.cuh?添加為vc++類型,點擊確定按鈕。?把全部.cu文件關(guān)閉,再打開,.cu文件C++關(guān)鍵字就高亮了。
在Windows 10上搭建TensorFlow環(huán)境
在Windows 10上搭建TensorFlow環(huán)境
- 版權(quán)聲明:本文為博主chszs的原創(chuàng)文章,未經(jīng)博主允許不得轉(zhuǎn)載。
了解如何為受支持的GPU測試Windows系統(tǒng),安裝和配置所需的驅(qū)動程序,獲取最新的TensorFlow每日構(gòu)建版并確保其正常工作。
在前面的文章中,我展示了如何測試你的Linux系統(tǒng),看看你是否能夠按照帶GPU支持的TensorFlow。在本文中,我將介紹如何在Windows 10上搭建TensorFlow環(huán)境。
同樣,仍然需要Python環(huán)境和pip工具。
1、獲取Python和pip
在Windows環(huán)境安裝Python 3.x版本,通常安裝包中集成了pip工具,安裝會非常簡單方便。具體見:https://www.python.org/downloads/windows/
一旦下載并執(zhí)行,需要確保選擇安裝的自定義選項。可以看到如下界面:
【CUDA】CUDA9.0+VS2017+win10詳細配置
??CUDA9.0是目前最新的Cuda版本,VS2017也是目前最新的Visual Studio版本,當前(2017/09)網(wǎng)上很少有CUDA9.0+VS2017的配置。
??為什么非要用CUDA9.0呢?因為CUDA8.0是與VS2017不兼容的,就是說如果想用CUDA8.0,必須使用VS2015以下的VS版本。好消息是CUDA9.0開始兼容VS2017,以后CUDA9.0+VS2017將會成為一種趨勢。
??在參考以前的成功配置案例后,博主決定寫寫最新的配置教程,以供大家參考。
CUDA9.0安裝:
??CUDA(Compute Unified Device Architecture),是顯卡廠商NVIDIA推出的運算平臺。 CUDA?是一種由NVIDIA推出的通用并行計算架構(gòu),該架構(gòu)使GPU能夠解決復雜的計算問題。 它包含了CUDA指令集架構(gòu)(ISA)以及GPU內(nèi)部的并行計算引擎。 開發(fā)人員現(xiàn)在可以使用C語言來為CUDA?架構(gòu)編寫程序,C語言是應(yīng)用最廣泛的一種高級編程語言。所編寫出的程序于是就可以在支持CUDA?的處理器上以超高性能運行。
??首先是CUDA9.0RC的下載:https://developer.nvidia.com/cuda-release-candidate-download,由于還是測試版,所以需要NVIDIA開發(fā)人員計劃的成員資格。需登錄以獲取訪問權(quán)限并完成此免費加入程序的簡短申請(網(wǎng)盤或者貼吧是很好的資源…)。
??下載后我們將會得到這個exe文件:
??下面是安裝過程(按照默認安裝):
??在安裝CUDA9.0之前,本人已經(jīng)是安裝好了VS2017,所以系統(tǒng)檢查時顯示無誤,綠燈通過。
??接下來就是同意繼續(xù)下一步,等待CUDA安裝的結(jié)束。
??PS:如果要卸載舊版本的CUDA,可在控制面板中選擇“程序和功能”,選擇應(yīng)用程序后右鍵卸載。至于注冊表問題是否需要變動,博主卸載CUDA8.0后安裝CUDA9.0并未發(fā)現(xiàn)問題。如果大家在安裝過程中遇到問題,可百度或谷歌如何操作。
設(shè)置環(huán)境變量:
??安裝結(jié)束后,我們在計算機上點右鍵,打開屬性->高級系統(tǒng)設(shè)置->環(huán)境變量,可以看到系統(tǒng)中多了CUDA_PATH和CUDA_PATH_V9_0兩個環(huán)境變量。
??我們還需要在環(huán)境變量中添加如下幾個變量:
CUDA_SDK_PATH = C:\ProgramData\NVIDIA Corporation\CUDA Samples\v9.0 CUDA_LIB_PATH = \lib\x64 CUDA_BIN_PATH = \bin CUDA_SDK_BIN_PATH = \bin\win64 CUDA_SDK_LIB_PATH = \common\lib\x64- 1
- 2
- 3
- 4
- 5
??設(shè)置完成之后,我們可以打開cmd來查看。
??下一步是監(jiān)測cuda安裝成功與否:
??在cuda安裝文件夾中有deviceQuery.exe 和 bandwidthTest.exe兩個程序。首先啟動cmd DOS命令窗口,默認進來的是c:\users\Admistrator>路徑,輸入 cd .. 兩次,來到c:目錄下輸入dir 找到安裝的cuda文件夾。
??分別輸入deviceQuery.exe 和 bandwidthTest.exe,運行結(jié)果如圖所示。Rsult=PASS則說明通過,反之,Rsult=Fail 則需要重新安裝。
??如果以上都沒問題,則說明CUDA9.0安裝成功。下一步是在VS2017平臺上配置CUDA9.0。
VS2017配置:
??1.打開vs2017,我們可以觀察到,在VS2017模板一欄下方出現(xiàn)了“NVIDIA/CUDA 9.0”。創(chuàng)建一個空win32程序,即cuda_test項目。
??2.右鍵源文件文件夾->添加->新建項->選擇CUDA C/C++File,取名cuda_main。
??3.選擇cuda_test,點擊右鍵–>項目依賴項–>自定義生成,選擇CUDA9.0。
??4.點擊cuda_main.cu的屬性,在配置屬性–>常規(guī)–>項類型–>選擇“CUDA C/C++”。
項目配置:
1.x64
?1.1 包含目錄配置
??1.右鍵點擊項目屬性–>屬性–>配置屬性–>VC++目錄–>包含目錄
??2.添加包含目錄:
???$(CUDA_PATH)\include
?1.2 庫目錄配置
??1.VC++目錄–>庫目錄
??2.添加庫目錄:
???$(CUDA_PATH)\lib\x64
?1.3 依賴項
???配置屬性–>鏈接器–>輸入–>附加依賴項
???添加庫文件:
????cublas.lib
????cuda.lib
????cudadevrt.lib
????cudart.lib
????cudart_static.lib
????nvcuvid.lib
????OpenCL.lib
??注意:添加nvcuvenc.lib庫文件,編譯時,報找不到該文件的錯誤。去掉后,程序也能運行
2.x86(win32)
?2.1 包含目錄配置
??右鍵點擊項目屬性–>屬性–>配置屬性–>VC++目錄–>包含目錄
??添加包含目錄:
???$(CUDA_PATH)\include
?2.2 庫目錄配置
??1.VC++目錄–>庫目錄
??2.添加庫目錄:
???$(CUDA_PATH)\lib\Win32
?2.3 依賴項
???配置屬性–>連接器–>輸入–>附加依賴項
???添加庫文件:
????cuda.lib
????cudadevrt.lib
????cudart.lib
????cudart_static.lib
????nvcuvid.lib
????OpenCL.lib
??備注: win32和x64位的lib庫有差別,配置時需注意,除了上述添加的lib文件外,x64還有其他的lib庫文件,如cublas.lib,如運行1.6的樣例時,要添加這個庫,不然會編譯失敗。
測試
// CUDA runtime 庫 + CUBLAS 庫 #include "cuda_runtime.h" #include "cublas_v2.h" #include <time.h> #include <iostream> using namespace std; // 定義測試矩陣的維度 int const M = 5; int const N = 10; int main() { // 定義狀態(tài)變量 cublasStatus_t status; // 在 內(nèi)存 中為將要計算的矩陣開辟空間 float *h_A = (float*)malloc (N*M*sizeof(float)); float *h_B = (float*)malloc (N*M*sizeof(float)); // 在 內(nèi)存 中為將要存放運算結(jié)果的矩陣開辟空間 float *h_C = (float*)malloc (M*M*sizeof(float)); // 為待運算矩陣的元素賦予 0-10 范圍內(nèi)的隨機數(shù) for (int i=0; i<N*M; i++) { h_A[i] = (float)(rand()%10+1); h_B[i] = (float)(rand()%10+1); } // 打印待測試的矩陣 cout << "矩陣 A :" << endl; for (int i=0; i<N*M; i++){ cout << h_A[i] << " "; if ((i+1)%N == 0) cout << endl; } cout << endl; cout << "矩陣 B :" << endl; for (int i=0; i<N*M; i++){ cout << h_B[i] << " "; if ((i+1)%M == 0) cout << endl; } cout << endl; /* ** GPU 計算矩陣相乘 */ // 創(chuàng)建并初始化 CUBLAS 庫對象 cublasHandle_t handle; status = cublasCreate(&handle); if (status != CUBLAS_STATUS_SUCCESS) { if (status == CUBLAS_STATUS_NOT_INITIALIZED) { cout << "CUBLAS 對象實例化出錯" << endl; } getchar (); return EXIT_FAILURE; } float *d_A, *d_B, *d_C; // 在 顯存 中為將要計算的矩陣開辟空間 cudaMalloc ( (void**)&d_A, // 指向開辟的空間的指針 N*M * sizeof(float) // 需要開辟空間的字節(jié)數(shù) ); cudaMalloc ( (void**)&d_B, N*M * sizeof(float) ); // 在 顯存 中為將要存放運算結(jié)果的矩陣開辟空間 cudaMalloc ( (void**)&d_C, M*M * sizeof(float) ); // 將矩陣數(shù)據(jù)傳遞進 顯存 中已經(jīng)開辟好了的空間 cublasSetVector ( N*M, // 要存入顯存的元素個數(shù) sizeof(float), // 每個元素大小 h_A, // 主機端起始地址 1, // 連續(xù)元素之間的存儲間隔 d_A, // GPU 端起始地址 1 // 連續(xù)元素之間的存儲間隔 ); cublasSetVector ( N*M, sizeof(float), h_B, 1, d_B, 1 ); // 同步函數(shù) cudaThreadSynchronize(); // 傳遞進矩陣相乘函數(shù)中的參數(shù),具體含義請參考函數(shù)手冊。 float a=1; float b=0; // 矩陣相乘。該函數(shù)必然將數(shù)組解析成列優(yōu)先數(shù)組 cublasSgemm ( handle, // blas 庫對象 CUBLAS_OP_T, // 矩陣 A 屬性參數(shù) CUBLAS_OP_T, // 矩陣 B 屬性參數(shù) M, // A, C 的行數(shù) M, // B, C 的列數(shù) N, // A 的列數(shù)和 B 的行數(shù) &a, // 運算式的 α 值 d_A, // A 在顯存中的地址 N, // lda d_B, // B 在顯存中的地址 M, // ldb &b, // 運算式的 β 值 d_C, // C 在顯存中的地址(結(jié)果矩陣) M // ldc ); // 同步函數(shù) cudaThreadSynchronize(); // 從 顯存 中取出運算結(jié)果至 內(nèi)存中去 cublasGetVector ( M*M, // 要取出元素的個數(shù) sizeof(float), // 每個元素大小 d_C, // GPU 端起始地址 1, // 連續(xù)元素之間的存儲間隔 h_C, // 主機端起始地址 1 // 連續(xù)元素之間的存儲間隔 ); // 打印運算結(jié)果 cout << "計算結(jié)果的轉(zhuǎn)置 ( (A*B)的轉(zhuǎn)置 ):" << endl; for (int i=0;i<M*M; i++){ cout << h_C[i] << " "; if ((i+1)%M == 0) cout << endl; } // 清理掉使用過的內(nèi)存 free (h_A); free (h_B); free (h_C); cudaFree (d_A); cudaFree (d_B); cudaFree (d_C); // 釋放 CUBLAS 庫對象 cublasDestroy (handle); getchar(); return 0; }- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
- 35
- 36
- 37
- 38
- 39
- 40
- 41
- 42
- 43
- 44
- 45
- 46
- 47
- 48
- 49
- 50
- 51
- 52
- 53
- 54
- 55
- 56
- 57
- 58
- 59
- 60
- 61
- 62
- 63
- 64
- 65
- 66
- 67
- 68
- 69
- 70
- 71
- 72
- 73
- 74
- 75
- 76
- 77
- 78
- 79
- 80
- 81
- 82
- 83
- 84
- 85
- 86
- 87
- 88
- 89
- 90
- 91
- 92
- 93
- 94
- 95
- 96
- 97
- 98
- 99
- 100
- 101
- 102
- 103
- 104
- 105
- 106
- 107
- 108
- 109
- 110
- 111
- 112
- 113
- 114
- 115
- 116
- 117
- 118
- 119
- 120
- 121
- 122
- 123
- 124
- 125
- 126
- 127
- 128
- 129
- 130
- 131
- 132
- 133
- 134
- 135
- 136
- 137
- 138
- 139
- 140
- 141
- 142
- 143
- 144
- 145
- 146
- 147
- 148
- 149
- 150
- 151
- 152
- 153
- 154
- 155
- 156
- 157
??運行結(jié)果如圖所示,說明配置已經(jīng)完成且能正常運行程序。
完成安裝后,可以打開命令提示符并鍵入python,以查看您正在使用的版本。這里可以看到,我下載了3.6.4版:
然后可以退出Python解釋器環(huán)境:
exit()- 1
- 2
然后測試pip工具安裝的情況:
pip -V- 1
- 2
可以看到這樣:
接下來,在安裝TensorFlow之前,需要先檢查主機的GPU是否支持,在命令提示符下,執(zhí)行命令:
control /name Microsoft.DeviceManager- 1
- 2
然后查看“顯示適配器”設(shè)置,將其打開,然后閱讀顯示適配器的名稱,如下:
正如你所看到的,主機系統(tǒng)有一個GTX 980 Ti。然后去NVIDIA官網(wǎng)查看信息,具體見:https://developer.nvidia.com/cuda-gpus,就可以知道是否可以使用帶GPU支持的TensorFlow。這里已經(jīng)確定是支持的。但是在安裝和運行TensorFlow之前,需要為你的機器安裝CUDA驅(qū)動。
2、安裝CUDA驅(qū)動程序
要說明一點,目前TensorFlow的每日構(gòu)建版提供了對CUDA 9.0的支持,而Release版則只能支持CUDA 8.0版。如果訪問CUDA的下載網(wǎng)站,見:https://developer.nvidia.com/cuda-toolkit,可以看到CUDA目前的最新版本是9.1版,因此請確保通過選擇下面的“Legacy Releases”鏈接來下載正確版本的驅(qū)動程序。
在運行TensorFlow之前,還需要一個與主機的CUDA版本相匹配的CuDNN版本。
3、安裝TensorFlow
安裝TensorFlow的Nightly Build版。從命令提示符下安裝它,只需輸入:
pip install tf-nightly-gpu- 1
- 2
一旦安裝完成,在命令提示符窗口中輸入:
python- 1
- 2
打開Python編輯器,在其中輸入:
import tensorflow as tf- 1
- 2
如果CUDA驅(qū)動程序有錯誤,就可能會顯示 cudart64_XX.dll 失敗,其中XX是版本號。
如果CUDA驅(qū)動程序正確,但CuDNN驅(qū)動程序有錯誤,就可能會顯示說 cudnn64_X.dll 缺少什么東西,其中X是一個版本號。
4、安裝CuDNN庫
CuDNN庫是CUDA針對深度神經(jīng)網(wǎng)絡(luò)的更新包,TensorFlow會使用它用于加速NVidia GPU上的深度學習。可以從這里下載,見:https://developer.nvidia.com/cudnn。
但必須首先要注冊一個NVidia開發(fā)者帳號,它是免費的。登錄后,您會看到各種CuDNN下載。然后選擇匹配的版本。由于之前使用了CUDA 9.0,所以確定為CUDA 9.0選擇了cuDNN v7.0.5。
下載下來的是一個包含了幾個文件夾的ZIP文件,每個文件夾包含CuDNN文件(一個DLL,一個頭文件和一個庫文件)。找到你的CUDA安裝目錄,這里應(yīng)該是這樣的:
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0- 1
- 2
可以看到從ZIP文件的目錄也在這個目錄,即有一個bin、一個include,一個lib等。將文件從ZIP復制到相關(guān)的目錄。
比如把cudnn64_7.dll文件拖拽到C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0\bin目錄,其它相似。
完成后,重新打開命令提示符窗口并再次測試TensorFlow!
import tensorflow as tf- 1
- 2
然后,可以輸入以下內(nèi)容來檢查TensorFlow版本:
print(tf.__version__)- 1
- 2
可以看到TensorFlow的版本得以正確顯示:
總結(jié)
以上是生活随笔為你收集整理的Windows 10 安装使用TensorFlow-GPU的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 兰花
- 下一篇: android看黑白电子书软件,如何优雅