解决Mask RCNN训练时GPU内存溢出问题
首先自己是個小白對于如何使用GPU跑程序這個學習了一下:
(1)使用的是putty,安裝了Anaconda這個IDE環境,用的conda install tensorflow-gpu安裝的GPU版本tf,之前只是安裝了tf并沒有選擇GPU版本。安裝完GPU版本的tf,可以進入python環境導入import tensorflow as tf 進行測試一下,如果沒有報錯即為成功。
(2)并在自己Train.ipynb代碼中添加 ? import os
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? os.environ["CUDA_DEVICE_ORDER"]="PCI_BUS_ID"
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? os.environ["CUDA_VISIBLE_DEVICES"]="0"
即可調用GPU運行。
(3)由于自己的圖片量太大,就報錯大致意思是內存溢出。
用top命令查看GPU進程,發現自己開了好多沒關占用內存量,所以重啟了一下服務器,
并將一部分參數進行修改將IMAGE_MIN_DIM分別調小一倍。STEPS_PER_EPOCH=1 ?? VALIDATION_STEPS=1? 即可進行重新訓練。
總結
以上是生活随笔為你收集整理的解决Mask RCNN训练时GPU内存溢出问题的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 记录服务器连接jupyter noteb
- 下一篇: coco格式的数据集进行训练