NVIDIA TX2---Tegra架构介绍
一、Tegra發(fā)展以及各Tegra對比
1、Tegra發(fā)展
(1)2008年2月,NVIDIA與Microsoft合作開發(fā)基于ARM11架構(gòu)的APX 2500應(yīng)用處理器發(fā)布。
(2)隨后英偉達(dá)發(fā)布Tegra產(chǎn)品Tegra 600 和 Tegra 650,集成的顯示核心是基于GeForce 6,并加入了對CUDA和雙精度浮點(diǎn)運(yùn)算的支持。
2、Tegra發(fā)展圖譜
3、各Tegra簡要對比
?
二、Tegra X1/X2 架構(gòu)解析
1、Tegra X1架構(gòu)解析
(1)NVIDIA GeForce Maxwell 圖形處理單元(GPU);
(2)四核 ARM Cortex-A57 核心;
(3)64位DRAM接口提供了高寬帶;
(4)基于一個Cortex-A9處理器和獨(dú)立RAM的獨(dú)立音頻子系統(tǒng);
(5)雙顯示控制器;
(6)高性能H.265/H.264視頻硬件編碼器,以及編碼器完全支持超高清的10位像素4K視頻60fps。
2、Maxwell架構(gòu)解析
(1)相對Kepler而言,Maxwell重構(gòu)了新的SMM以提高效率,全新的數(shù)據(jù)通路管理與組織;
(2)每個SMM包含4個Warp Schedulers;
(3)每個Warp?Scheduler可以在每個Warp周期發(fā)起兩條指令;
(4)Maxwell的CUDA Core是Kepler性能的1.4倍;
(5)2 SMM * 4 Warp Scheduler * 32 CUDA Core Processing Blocks = 256 CUDA Core
3、CUDA Core
4、Kepler VS?Maxwell
5、GTX 980 VS TX1
6、Tegra X2架構(gòu)解析
(1)NVIDIA Pascal 圖形處理單元(GPU)架構(gòu);
(2)雙核NVIDIA Denver 2 ARM CPU 核心,加四核ARM Cortex-A57核心;
(3)基于一個Cortex-A9處理器和獨(dú)立RAM的獨(dú)立音頻子系統(tǒng);
(4)基于獨(dú)立的ARM Cortex-R5F 傳感器處理器;
(5)基于獨(dú)立的ARM Cortex-R5F 處理器子系統(tǒng)用于處理啟動和能量管理;
(6)基于獨(dú)立的ARM Cortex-R5F 處理器子系統(tǒng)用于處理攝像頭管理;
(7)128位DRAM接口提供了高寬帶的LPDDR4支持。
7、Pascal 架構(gòu)解析
(1)相對于Kepler,Pascal簡化了數(shù)據(jù)通路組織與管理,降低了Die區(qū)域大小,降低了數(shù)據(jù)傳輸時的能量消耗;
(2)新的SM調(diào)度器架構(gòu)基于Maxwell調(diào)度器,且更加的智能化,即提高了性能有降低了功耗;
(3)一個SM內(nèi)有2個Warp Scheduler,每個Warp Scheduler 可以在每個Warp周期發(fā)起兩條指令;
(4)一個Warp Scheduler內(nèi)有32個單精度CUDA Core。
8、Pascal VS Maxwell
9、Jetson TX1 VS Jetson TX2
10、TX1處理器性能
11、TX1圖形性能
?
三、ARM Cortex-A57架構(gòu)解析
1、ARM處理器家族
2、ARM Cortex-A57架構(gòu)解析
(1)完全遵循 ARMv8-A 指令集規(guī)范;
(2)超標(biāo)量,可變長度,亂序執(zhí)行流水線;
(3)帶有分支目標(biāo)緩沖(BTB)與全局歷史緩沖(GHB)RAM,一個返回堆棧,以及一個間接預(yù)測器的動態(tài)分支預(yù)測;
(4)AMBA 4 AXI 一致性擴(kuò)展(ACE)或CHI 主機(jī)接口;
(5)實(shí)現(xiàn)了加速器一致性端口(ACP)為AXI4一致性從機(jī)接口;
(6)支持基于ETMv4架構(gòu)的嵌入式跟蹤單元(ETM);
(7)支持基于PMUv3架構(gòu)的性能監(jiān)控單元(PMU);
(8)用于多處理器調(diào)試的交叉觸發(fā)接口(CTI);
(9)通用中斷控制器(GIC)CPU接口。
3、ARM Cortex-A57的性能
4、AArch32 VS AArch64
5、NEON架構(gòu)解析
(1)架構(gòu)分析
(2)NEON數(shù)據(jù)讀取模式
(3)NEON架構(gòu)對比
?
四、Tegra工作原理與軟件架構(gòu)
1、Tegra 工作原理
2、Tegra中斷控制
(1)一共有0-192號全局中斷,由六個中斷控制器分別管理;
(2)TX1中斷控制器分為兩類:GIC400與LIC;
(3)GIC400是ARM Cortex-A57 的中斷控制器;
(4)LIC是屬于輕量級BPMP處理器的中斷控制器;
(5)任何處理器都可以發(fā)送一個軟件中斷給其它一個或多個處理器(包括自身),但是IPI中斷志限于A57之間(包括自身);
(6)每個ARM處理器都有兩個引腳來接收IRQ和FIQ中斷,因?yàn)榈碗娖接|發(fā),因此命名nFIQ和nIRQ;
3、Component 軟件結(jié)構(gòu)
(1)OS Images:JetPack包含來自Ubuntu的樣例文件系統(tǒng);
(2)Libraries:CUDA Toolkit(Linux下CUDA開發(fā)工具鏈)、TensorRT and cuDNN(高性能深度學(xué)習(xí)應(yīng)用)、VisionWorks and Opencv(視覺計(jì)算應(yīng)用);
(3)Developer Tools:Tegra Graphics Debugger(調(diào)試OpenGL控制臺級別地 工程)、Tegra System Profiler(系統(tǒng)調(diào)試跟蹤分析器,提高CPU效率)、PerfKit(提供訪問GPU性能統(tǒng)計(jì))、Samples(NVIDIA GameWorks Vulkan 以及 OpenGL 范例)。
4、VisionWorks 軟件結(jié)構(gòu)
?
五、Jetson 開發(fā)注意事項(xiàng)
1、Jetson 功能概覽
2、Jetson功能布局
3、Jetson注意事項(xiàng)
(1)0-50℃溫度范圍內(nèi)工作;
(2)不同用戶的eMMC、DRAM廠商型號可能不同;
(3)SATA不支持熱插拔;
(4)除了IIC_GPI是3.3V以外,其它的IIC接口都是1.8V接口;
(5)TX1生命期(EOL)至2021年1月(商業(yè)級);
(6)Jetson TX1只有四核A57,沒有A53;
(7)上電后風(fēng)扇不轉(zhuǎn),自動風(fēng)扇調(diào)速;
(8)默認(rèn)沒安裝系統(tǒng),新的模塊上電后無任何反應(yīng)。
4、CUDA開發(fā)注意事項(xiàng)
5、Jetson 開發(fā)注意事項(xiàng)
?
致謝
1、《Jetson開發(fā)者入門之Tegra架構(gòu)解析》
2、NVIDIA-Jetson_github
全文轉(zhuǎn)自:https://blog.csdn.net/qq_38880380/article/details/79667765
總結(jié)
以上是生活随笔為你收集整理的NVIDIA TX2---Tegra架构介绍的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。