當前位置：首頁 > 运维知识 > windows >内容正文

windows

Windows 10 安装使用TensorFlow-GPU

發(fā)布時間：2024/1/8 windows 27 豆豆

生活随笔收集整理的這篇文章主要介紹了 Windows 10 安装使用TensorFlow-GPU 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

Windows 10 安裝使用TensorFlow-GPU

當前環(huán)境描述：Win10 64位，Python3.6

目標：安裝使用TensorFlow1.6-GPU

所需文件：Cuda9.0、Cudnn7.0

注意：安裝Cuda9.1 & Cudnn7.1的環(huán)境下將不能正常使用TF1.6-GPU

Tensorflow 官網(wǎng)安裝描述如下：

網(wǎng)址：https://tensorflow.google.cn/install/install_windows

步驟：
1、下載安裝Cuda9.0

網(wǎng)址：https://developer.nvidia.com/cuda-90-download-archive?target_os=Windows&target_arch=x86_64&target_version=10

注意：搜索CUDA進入下載界面默認下載最新的9.1版本，

步驟：搜索cuda9，進入后點擊下載，下載完成直接安裝即可

2、下載安裝Cudnn7.0、添加進path

網(wǎng)址：https://developer.nvidia.com/rdp/cudnn-download

注意：下載Cudnn會需要注冊，并且完成問卷調(diào)查

步驟：下載完成后為安裝包形式，解壓后為復制到cuda9.0的路徑

Cuda9.0默認路徑為：C:\Program?Files\NVIDIA?GPU?Computing?Toolkit\CUDA\v9.0

3、安裝TF1.6-GPU

步驟：直接pip install --upgradetensorflow-gpu

4、驗證測試

安裝好后打開python，

引用tensorflow，新建一個常量，再打印出來

語句如下：

import?tensorflow?as?tf

hello?=?tf.constant('Hello,?TensorFlow!')

sess?=?tf.Session()

print(sess.run(hello))

若安裝成功則會再運行sess?=?tf.Session()的時候出現(xiàn)自己的GPU型號等信息

截圖如下：

如果不能正常使用：

1、檢查所有的版本是否正確，當前版本 win10 64位、python3.6、cuda9.0、cudnn7.0、tensorflow1.6-gpu

2、確認cuda的環(huán)境變量已經(jīng)添加、如果還是不行再將cudnn解壓后的cudnn/bin路徑添加到環(huán)境變量

cuda 9.0 + vs2015 環(huán)境搭建

2017年11月06日 15:29:01 閱讀數(shù)：8075 cuda 9.0 + vs2015 總結(jié)：搭建還算順利，全自動，沒毛病系統(tǒng)硬件屬性： win7 64位 + GTX960 +內(nèi)存16G
先下載安裝vs2015，當然vs2017也是可以的，cuda9.0支持2017 cuda 9.0 下載地址： https://developer.nvidia.com/cuda-downloads 我配置如下：
點擊下載本地版。
下載結(jié)束后，點擊exe運行安裝：

路徑自己定義，這邊我制定到我自己的E盤，解壓的時候出現(xiàn)無法創(chuàng)建 d3dcompiler_47.dll的文件，我就重新安裝到D盤，就沒事了，具體不知道什么原因，這里記錄一下。
下面可以選擇精簡也可以自定義安裝，需要幾分鐘時間，一般不會有什么問題。

安裝結(jié)束后會有一個提示框，勾選那三項，會直接運行安裝好的程序和顯示cuda vs的sample。
點擊2015vs 的sln工程文件，會初始化打開cuda vs sample工程，打開這個工程自己手動build一下，正常情況下不會有問題，直接生成exe，如果有問題看一下項目屬性后需要配置一個屬性，右鍵點擊工程屬性：

cuda目錄要最終選擇到版本號這個文件，比如我是C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0
點擊應(yīng)用，確定，然后開始build 這個項目，編譯成功。我隨便選了一個gl的項目

這邊另外配置一點可以高亮cu文件和去掉提示錯誤的一個方法：設(shè)置方法:?在VS2010的菜單?依次點擊：“Tools|Options…|Text Editor|File Extension”，在這個界面里：?“Editor” 下拉框選“Microsoft Visual C++”，在“Extension”文本框輸入 .cu?點擊“Add”按鈕?，重復工作把.cuh?添加為vc++類型，點擊確定按鈕。?把全部.cu文件關(guān)閉，再打開，.cu文件C++關(guān)鍵字就高亮了。

在Windows 10上搭建TensorFlow環(huán)境

版權(quán)聲明：本文為博主chszs的原創(chuàng)文章，未經(jīng)博主允許不得轉(zhuǎn)載。

了解如何為受支持的GPU測試Windows系統(tǒng)，安裝和配置所需的驅(qū)動程序，獲取最新的TensorFlow每日構(gòu)建版并確保其正常工作。

在前面的文章中，我展示了如何測試你的Linux系統(tǒng)，看看你是否能夠按照帶GPU支持的TensorFlow。在本文中，我將介紹如何在Windows 10上搭建TensorFlow環(huán)境。

同樣，仍然需要Python環(huán)境和pip工具。

1、獲取Python和pip

在Windows環(huán)境安裝Python 3.x版本，通常安裝包中集成了pip工具，安裝會非常簡單方便。具體見：https://www.python.org/downloads/windows/

一旦下載并執(zhí)行，需要確保選擇安裝的自定義選項。可以看到如下界面：

【CUDA】CUDA9.0+VS2017+win10詳細配置

??CUDA9.0是目前最新的Cuda版本，VS2017也是目前最新的Visual Studio版本，當前（2017/09）網(wǎng)上很少有CUDA9.0+VS2017的配置。

??為什么非要用CUDA9.0呢？因為CUDA8.0是與VS2017不兼容的，就是說如果想用CUDA8.0，必須使用VS2015以下的VS版本。好消息是CUDA9.0開始兼容VS2017，以后CUDA9.0+VS2017將會成為一種趨勢。

??在參考以前的成功配置案例后，博主決定寫寫最新的配置教程，以供大家參考。

CUDA9.0安裝：

??CUDA(Compute Unified Device Architecture)，是顯卡廠商NVIDIA推出的運算平臺。 CUDA?是一種由NVIDIA推出的通用并行計算架構(gòu)，該架構(gòu)使GPU能夠解決復雜的計算問題。它包含了CUDA指令集架構(gòu)（ISA）以及GPU內(nèi)部的并行計算引擎。開發(fā)人員現(xiàn)在可以使用C語言來為CUDA?架構(gòu)編寫程序，C語言是應(yīng)用最廣泛的一種高級編程語言。所編寫出的程序于是就可以在支持CUDA?的處理器上以超高性能運行。

??首先是CUDA9.0RC的下載：https://developer.nvidia.com/cuda-release-candidate-download，由于還是測試版，所以需要NVIDIA開發(fā)人員計劃的成員資格。需登錄以獲取訪問權(quán)限并完成此免費加入程序的簡短申請(網(wǎng)盤或者貼吧是很好的資源…）。

??下載后我們將會得到這個exe文件：

??下面是安裝過程（按照默認安裝）：

??在安裝CUDA9.0之前，本人已經(jīng)是安裝好了VS2017,所以系統(tǒng)檢查時顯示無誤，綠燈通過。

??接下來就是同意繼續(xù)下一步，等待CUDA安裝的結(jié)束。

??PS:如果要卸載舊版本的CUDA，可在控制面板中選擇“程序和功能”，選擇應(yīng)用程序后右鍵卸載。至于注冊表問題是否需要變動，博主卸載CUDA8.0后安裝CUDA9.0并未發(fā)現(xiàn)問題。如果大家在安裝過程中遇到問題，可百度或谷歌如何操作。

設(shè)置環(huán)境變量：

??安裝結(jié)束后，我們在計算機上點右鍵，打開屬性->高級系統(tǒng)設(shè)置->環(huán)境變量，可以看到系統(tǒng)中多了CUDA_PATH和CUDA_PATH_V9_0兩個環(huán)境變量。

??我們還需要在環(huán)境變量中添加如下幾個變量：

CUDA_SDK_PATH = C:\ProgramData\NVIDIA Corporation\CUDA Samples\v9.0 CUDA_LIB_PATH = %CUDA_PATH%\lib\x64 CUDA_BIN_PATH = %CUDA_PATH%\bin CUDA_SDK_BIN_PATH = %CUDA_SDK_PATH%\bin\win64 CUDA_SDK_LIB_PATH = %CUDA_SDK_PATH%\common\lib\x64

??設(shè)置完成之后，我們可以打開cmd來查看。

??下一步是監(jiān)測cuda安裝成功與否:

??在cuda安裝文件夾中有deviceQuery.exe 和 bandwidthTest.exe兩個程序。首先啟動cmd DOS命令窗口，默認進來的是c:\users\Admistrator>路徑，輸入 cd .. 兩次，來到c:目錄下輸入dir 找到安裝的cuda文件夾。

??分別輸入deviceQuery.exe 和 bandwidthTest.exe，運行結(jié)果如圖所示。Rsult=PASS則說明通過，反之，Rsult=Fail 則需要重新安裝。

??如果以上都沒問題，則說明CUDA9.0安裝成功。下一步是在VS2017平臺上配置CUDA9.0。

VS2017配置：

??1.打開vs2017，我們可以觀察到，在VS2017模板一欄下方出現(xiàn)了“NVIDIA/CUDA 9.0”。創(chuàng)建一個空win32程序,即cuda_test項目。

??2.右鍵源文件文件夾->添加->新建項->選擇CUDA C/C++File，取名cuda_main。

??3.選擇cuda_test，點擊右鍵–>項目依賴項–>自定義生成，選擇CUDA9.0。

??4.點擊cuda_main.cu的屬性,在配置屬性–>常規(guī)–>項類型–>選擇“CUDA C/C++”。

項目配置：

1.x64

?1.1 包含目錄配置
??1.右鍵點擊項目屬性–>屬性–>配置屬性–>VC++目錄–>包含目錄
??2.添加包含目錄：
???$(CUDA_PATH)\include

?1.2 庫目錄配置
??1.VC++目錄–>庫目錄
??2.添加庫目錄：
???$(CUDA_PATH)\lib\x64

?1.3 依賴項
???配置屬性–>鏈接器–>輸入–>附加依賴項
???添加庫文件：
????cublas.lib
????cuda.lib
????cudadevrt.lib
????cudart.lib
????cudart_static.lib
????nvcuvid.lib
????OpenCL.lib

??注意：添加nvcuvenc.lib庫文件，編譯時，報找不到該文件的錯誤。去掉后，程序也能運行

2.x86(win32)

?2.1 包含目錄配置

??右鍵點擊項目屬性–>屬性–>配置屬性–>VC++目錄–>包含目錄
??添加包含目錄：
???$(CUDA_PATH)\include

?2.2 庫目錄配置
??1.VC++目錄–>庫目錄
??2.添加庫目錄：
???$(CUDA_PATH)\lib\Win32

?2.3 依賴項
???配置屬性–>連接器–>輸入–>附加依賴項
???添加庫文件：
????cuda.lib
????cudadevrt.lib
????cudart.lib
????cudart_static.lib
????nvcuvid.lib
????OpenCL.lib

??備注： win32和x64位的lib庫有差別，配置時需注意，除了上述添加的lib文件外，x64還有其他的lib庫文件，如cublas.lib,如運行1.6的樣例時，要添加這個庫，不然會編譯失敗。

測試

// CUDA runtime 庫 + CUBLAS 庫 #include "cuda_runtime.h" #include "cublas_v2.h" #include <time.h> #include <iostream> using namespace std; // 定義測試矩陣的維度 int const M = 5; int const N = 10; int main() { // 定義狀態(tài)變量 cublasStatus_t status; // 在內(nèi)存中為將要計算的矩陣開辟空間 float *h_A = (float*)malloc (N*M*sizeof(float)); float *h_B = (float*)malloc (N*M*sizeof(float)); // 在內(nèi)存中為將要存放運算結(jié)果的矩陣開辟空間 float *h_C = (float*)malloc (M*M*sizeof(float)); // 為待運算矩陣的元素賦予 0-10 范圍內(nèi)的隨機數(shù) for (int i=0; i<N*M; i++) { h_A[i] = (float)(rand()%10+1); h_B[i] = (float)(rand()%10+1); } // 打印待測試的矩陣 cout << "矩陣 A :" << endl; for (int i=0; i<N*M; i++){ cout << h_A[i] << " "; if ((i+1)%N == 0) cout << endl; } cout << endl; cout << "矩陣 B :" << endl; for (int i=0; i<N*M; i++){ cout << h_B[i] << " "; if ((i+1)%M == 0) cout << endl; } cout << endl; /* ** GPU 計算矩陣相乘 */ // 創(chuàng)建并初始化 CUBLAS 庫對象 cublasHandle_t handle; status = cublasCreate(&handle); if (status != CUBLAS_STATUS_SUCCESS) { if (status == CUBLAS_STATUS_NOT_INITIALIZED) { cout << "CUBLAS 對象實例化出錯" << endl; } getchar (); return EXIT_FAILURE; } float *d_A, *d_B, *d_C; // 在顯存中為將要計算的矩陣開辟空間 cudaMalloc ( (void**)&d_A, // 指向開辟的空間的指針 N*M * sizeof(float) //　需要開辟空間的字節(jié)數(shù) ); cudaMalloc ( (void**)&d_B, N*M * sizeof(float) ); // 在顯存中為將要存放運算結(jié)果的矩陣開辟空間 cudaMalloc ( (void**)&d_C, M*M * sizeof(float) ); // 將矩陣數(shù)據(jù)傳遞進顯存中已經(jīng)開辟好了的空間 cublasSetVector ( N*M, // 要存入顯存的元素個數(shù) sizeof(float), // 每個元素大小 h_A, // 主機端起始地址 1, // 連續(xù)元素之間的存儲間隔 d_A, // GPU 端起始地址 1 // 連續(xù)元素之間的存儲間隔 ); cublasSetVector ( N*M, sizeof(float), h_B, 1, d_B, 1 ); // 同步函數(shù) cudaThreadSynchronize(); // 傳遞進矩陣相乘函數(shù)中的參數(shù)，具體含義請參考函數(shù)手冊。 float a=1; float b=0; // 矩陣相乘。該函數(shù)必然將數(shù)組解析成列優(yōu)先數(shù)組 cublasSgemm ( handle, // blas 庫對象 CUBLAS_OP_T, // 矩陣 A 屬性參數(shù) CUBLAS_OP_T, // 矩陣 B 屬性參數(shù) M, // A, C 的行數(shù) M, // B, C 的列數(shù) N, // A 的列數(shù)和 B 的行數(shù) &a, // 運算式的 α 值 d_A, // A 在顯存中的地址 N, // lda d_B, // B 在顯存中的地址 M, // ldb &b, // 運算式的 β 值 d_C, // C 在顯存中的地址(結(jié)果矩陣) M // ldc ); // 同步函數(shù) cudaThreadSynchronize(); // 從顯存中取出運算結(jié)果至內(nèi)存中去 cublasGetVector ( M*M, // 要取出元素的個數(shù) sizeof(float), // 每個元素大小 d_C, // GPU 端起始地址 1, // 連續(xù)元素之間的存儲間隔 h_C, // 主機端起始地址 1 // 連續(xù)元素之間的存儲間隔 ); // 打印運算結(jié)果 cout << "計算結(jié)果的轉(zhuǎn)置 ( (A*B)的轉(zhuǎn)置 )：" << endl; for (int i=0;i<M*M; i++){ cout << h_C[i] << " "; if ((i+1)%M == 0) cout << endl; } // 清理掉使用過的內(nèi)存 free (h_A); free (h_B); free (h_C); cudaFree (d_A); cudaFree (d_B); cudaFree (d_C); // 釋放 CUBLAS 庫對象 cublasDestroy (handle); getchar(); return 0; }

??運行結(jié)果如圖所示，說明配置已經(jīng)完成且能正常運行程序。

完成安裝后，可以打開命令提示符并鍵入python，以查看您正在使用的版本。這里可以看到，我下載了3.6.4版：

然后可以退出Python解釋器環(huán)境：

exit()

然后測試pip工具安裝的情況：

pip -V

可以看到這樣：

接下來，在安裝TensorFlow之前，需要先檢查主機的GPU是否支持，在命令提示符下，執(zhí)行命令：

control /name Microsoft.DeviceManager

然后查看“顯示適配器”設(shè)置，將其打開，然后閱讀顯示適配器的名稱，如下：

正如你所看到的，主機系統(tǒng)有一個GTX 980 Ti。然后去NVIDIA官網(wǎng)查看信息，具體見：https://developer.nvidia.com/cuda-gpus，就可以知道是否可以使用帶GPU支持的TensorFlow。這里已經(jīng)確定是支持的。但是在安裝和運行TensorFlow之前，需要為你的機器安裝CUDA驅(qū)動。

2、安裝CUDA驅(qū)動程序

要說明一點，目前TensorFlow的每日構(gòu)建版提供了對CUDA 9.0的支持，而Release版則只能支持CUDA 8.0版。如果訪問CUDA的下載網(wǎng)站，見：https://developer.nvidia.com/cuda-toolkit，可以看到CUDA目前的最新版本是9.1版，因此請確保通過選擇下面的“Legacy Releases”鏈接來下載正確版本的驅(qū)動程序。

在運行TensorFlow之前，還需要一個與主機的CUDA版本相匹配的CuDNN版本。

3、安裝TensorFlow

安裝TensorFlow的Nightly Build版。從命令提示符下安裝它，只需輸入：

pip install tf-nightly-gpu

一旦安裝完成，在命令提示符窗口中輸入：

python

打開Python編輯器，在其中輸入：

import tensorflow as tf

如果CUDA驅(qū)動程序有錯誤，就可能會顯示 cudart64_XX.dll 失敗，其中XX是版本號。

如果CUDA驅(qū)動程序正確，但CuDNN驅(qū)動程序有錯誤，就可能會顯示說 cudnn64_X.dll 缺少什么東西，其中X是一個版本號。

4、安裝CuDNN庫

CuDNN庫是CUDA針對深度神經(jīng)網(wǎng)絡(luò)的更新包，TensorFlow會使用它用于加速NVidia GPU上的深度學習。可以從這里下載，見：https://developer.nvidia.com/cudnn。

但必須首先要注冊一個NVidia開發(fā)者帳號，它是免費的。登錄后，您會看到各種CuDNN下載。然后選擇匹配的版本。由于之前使用了CUDA 9.0，所以確定為CUDA 9.0選擇了cuDNN v7.0.5。

下載下來的是一個包含了幾個文件夾的ZIP文件，每個文件夾包含CuDNN文件（一個DLL，一個頭文件和一個庫文件）。找到你的CUDA安裝目錄，這里應(yīng)該是這樣的：

C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0

可以看到從ZIP文件的目錄也在這個目錄，即有一個bin、一個include，一個lib等。將文件從ZIP復制到相關(guān)的目錄。
比如把cudnn64_7.dll文件拖拽到C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0\bin目錄，其它相似。

完成后，重新打開命令提示符窗口并再次測試TensorFlow！

import tensorflow as tf

然后，可以輸入以下內(nèi)容來檢查TensorFlow版本：

print(tf.__version__)

可以看到TensorFlow的版本得以正確顯示：

總結(jié)

以上是生活随笔為你收集整理的Windows 10 安装使用TensorFlow-GPU的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇：兰花
下一篇： android看黑白电子书软件,如何优雅