GPU下train 模型出现nan
生活随笔
收集整理的這篇文章主要介紹了
GPU下train 模型出现nan
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
When training on GPU, the error "Model diverged with loss = NaN" is often caused by a sotmax that's getting a symbol larger than vocab_size
? ?
轉載于:https://www.cnblogs.com/wuxiangli/p/10344259.html
總結
以上是生活随笔為你收集整理的GPU下train 模型出现nan的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 关于颜色的代码可以告诉多点么?
- 下一篇: 颜色数字代码怎么表示的?