TensorFlow SSE/AVX/FMA 指令集编译
生活随笔
收集整理的這篇文章主要介紹了
TensorFlow SSE/AVX/FMA 指令集编译
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
當TensorFlow出現
I?tensorflow/core/platform/cpu_feature_guard.cc:140]?Your?CPU?supports?instructions?that?this?TensorFlow?binary?was?not?compiled?to?use: SSE4.1 SSE4.2 AVX AVX2?FMA?
等警告時,表明你的CPU指令集包括了這些指令集,當用pip的方式安裝默認是不編譯這些的,如果需要編譯這些以提高效率,需要自己下載tensorflow的源碼,進行編譯。
具體的編譯方法網上有不少文章,但中文的資料多少都有些不完整,如下面一篇博客算是比較完整的了
https://blog.csdn.net/iTaacy/article/details/72799833
但第5步之前仍然少了一個步驟去生成.wheel文件,生成.wheel文件的方法如下:
bazel-bin/tensorflow/tools/pip_package/build_pip_package /tmp/tensorflow_pkg參考自:
https://stackoverflow.com/questions/41293077/how-to-compile-tensorflow-with-sse4-2-and-avx-instructions
這樣才算完整的步驟。
?
值得一提的是,雖然解決了開頭說的警告,但在我用?的一個分詞工具上,效率并沒有提升。。分詞工具的作者也聯系不上。。
總結
以上是生活随笔為你收集整理的TensorFlow SSE/AVX/FMA 指令集编译的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 基于jsp(java)高校学生考勤管理系
- 下一篇: 数学中学生测试软件,欧拉初中数学软件