基于pytorch的模型剪枝+模型量化+BN合并+TRT部署(cifar数据)(2)
生活随笔
收集整理的這篇文章主要介紹了
基于pytorch的模型剪枝+模型量化+BN合并+TRT部署(cifar数据)(2)
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
1)量化:High-Bit(>2b): QAT, PTQ, QAFT; Low-Bit(≤2b)/Ternary and Binary: QAT
2)剪枝:正常、規整和分組卷積結構剪枝
3)針對特征(A)二值量化的BN融合(訓練量化后,BN參數 —> conv的偏置b)
4)High-Bit量化的BN融合(訓練量化中,先融合再量化,融合:BN參數 —> conv的權重w和偏置b)
對比實驗如下,相關代碼下載地址:下載地址
| 類型 | W(Bits) | A(Bits) | Acc | GFLOPs | Para(M) | Size(MB) | 壓縮率 | 損失 |
|---|---|---|---|---|---|---|---|---|
| 原模型(nin) | FP32 | FP32 | 91.01% | 0.15 | 0.67 | 2.68 | *** | *** |
| 采用分組卷積 |
總結
以上是生活随笔為你收集整理的基于pytorch的模型剪枝+模型量化+BN合并+TRT部署(cifar数据)(2)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 基于pytorch量化感知训练(mnis
- 下一篇: 【camera-radar】基于ROS的