中科寒武纪 AI 芯片弯道超车:NPU 为深度学习而 生、指令集是产业根本
人工智能領域深度學習興起;神經網絡規模快速增長,對計算能力需求提升。深度學習技術評為 2013 年十大突破性技術之首,帶動了人工智能的再次興起;深度學習憑借其更加優秀的擬合能力, 在語音識別、圖像處理等領域取得諸多本質性的突破。近些年,隨著深度學習的神經網絡規模的快 速增長,相關 AI 領域的識別準確率有了大幅提升,但是隨之而來的是:整體深度學習架構對計算 能力的需求有了爆發式的增長。
傳統計算架構在神經網絡處理方面有所欠缺。目前深度學習的基本操作是神經元和突觸的處理,傳 統的處理器指令集(包括 x86 和 ARM 等)是為了進行通用計算發展起來的,其基本操作為算術操 作(加減乘除)和邏輯操作(與或非),往往需要數百甚至上千條指令才能完成一個神經元的處理, 深度學習的處理效率不高。
中科寒武紀 NPU 專為神經網絡處理定制,提供高性能功耗比解決方案,賦能移動端 AI 芯片。中 科寒武紀是全球智能芯片領域的先行者,宗旨是打造各類智能云服務器、智能終端以及智能機器人 的核心處理器芯片。2016 年推出的寒武紀 1A 處理器(Cambricon-1A)是世界首款商用深度學習 專用處理器,面向智能手機、安防監控、可穿戴設備、無人機和智能駕駛等各類終端設備,在運行 主流智能算法時性能功耗比全面超越 CPU 和 GPU,與特斯拉增強型自動輔助駕駛、IBM Watson 等國內外新興信息技術的杰出代表同時入選第三屆世界互聯網大會(烏鎮)評選的十五項“世界互
聯網領先科技成果”。中科寒武紀 NPU 專為神經網絡定制:
1)、優化芯片架構,提升芯片對于神經網絡的處理效率。傳統架構存儲和處理是分離的,分別由 存儲器和運算器來實現(X86 處理器和英偉達 GPU);而神經網絡中存儲和處理是一體化的,都 是通過突觸權重來體現;當傳統架構計算神經網絡時將受到存儲和處理分離式結構的制約,因而影 響效率。寒武紀策略則通過“片上存儲”的方式盡量減少訪存次數,提升性能。
圖 6:通過改變芯片架構、優化片上存儲層次,降低訪存次數、提升性能
?
?
資料來源:中科寒武紀、中科院、東方證券研究所
?
2)、基于優化的芯片架構,針對性的提出神經網絡計算處理的指令集。傳統的計算架構并非是專 門針對神經網絡架構計算而設計;而寒武紀 NPU 芯片設計能夠對于任意規模 DNN、CNN、MLP、 SOM 等多種神經網絡算法能夠實現通用性的支撐,同時對神經元和突觸數據在芯片上的傳輸提供 了一系列專門的支持;實現一條指令即可完成一組神經元的處理。
?
?
?
?
總結
以上是生活随笔為你收集整理的中科寒武纪 AI 芯片弯道超车:NPU 为深度学习而 生、指令集是产业根本的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【C++难点收录】“为什么C++难,你真
- 下一篇: Error -151 @ 0x0