當(dāng)前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

NVIDIA TX2---Tegra架构介绍

發(fā)布時間：2023/12/18 编程问答 45 豆豆

生活随笔收集整理的這篇文章主要介紹了 NVIDIA TX2---Tegra架构介绍小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

一、Tegra發(fā)展以及各Tegra對比

1、Tegra發(fā)展

（1）2008年2月，NVIDIA與Microsoft合作開發(fā)基于ARM11架構(gòu)的APX 2500應(yīng)用處理器發(fā)布。

（2）隨后英偉達(dá)發(fā)布Tegra產(chǎn)品Tegra 600 和 Tegra 650，集成的顯示核心是基于GeForce 6，并加入了對CUDA和雙精度浮點(diǎn)運(yùn)算的支持。

2、Tegra發(fā)展圖譜

3、各Tegra簡要對比

二、Tegra X1/X2 架構(gòu)解析

1、Tegra X1架構(gòu)解析

（1）NVIDIA GeForce Maxwell 圖形處理單元（GPU)；

（2）四核 ARM Cortex-A57 核心；

（3）64位DRAM接口提供了高寬帶；

（4）基于一個Cortex-A9處理器和獨(dú)立RAM的獨(dú)立音頻子系統(tǒng)；

（5）雙顯示控制器；

（6）高性能H.265/H.264視頻硬件編碼器，以及編碼器完全支持超高清的10位像素4K視頻60fps。

2、Maxwell架構(gòu)解析

（1）相對Kepler而言，Maxwell重構(gòu)了新的SMM以提高效率，全新的數(shù)據(jù)通路管理與組織；

（2）每個SMM包含4個Warp Schedulers；

（3）每個Warp?Scheduler可以在每個Warp周期發(fā)起兩條指令；

（4）Maxwell的CUDA Core是Kepler性能的1.4倍；

（5）2 SMM * 4 Warp Scheduler * 32 CUDA Core Processing Blocks = 256 CUDA Core

3、CUDA Core

4、Kepler VS?Maxwell

5、GTX 980 VS TX1

6、Tegra X2架構(gòu)解析

（1）NVIDIA Pascal 圖形處理單元（GPU）架構(gòu)；

（2）雙核NVIDIA Denver 2 ARM CPU 核心，加四核ARM Cortex-A57核心；

（3）基于一個Cortex-A9處理器和獨(dú)立RAM的獨(dú)立音頻子系統(tǒng)；

（4）基于獨(dú)立的ARM Cortex-R5F 傳感器處理器；

（5）基于獨(dú)立的ARM Cortex-R5F 處理器子系統(tǒng)用于處理啟動和能量管理；

（6）基于獨(dú)立的ARM Cortex-R5F 處理器子系統(tǒng)用于處理攝像頭管理；

（7）128位DRAM接口提供了高寬帶的LPDDR4支持。

7、Pascal 架構(gòu)解析

（1）相對于Kepler，Pascal簡化了數(shù)據(jù)通路組織與管理，降低了Die區(qū)域大小，降低了數(shù)據(jù)傳輸時的能量消耗；

（2）新的SM調(diào)度器架構(gòu)基于Maxwell調(diào)度器，且更加的智能化，即提高了性能有降低了功耗；

（3）一個SM內(nèi)有2個Warp Scheduler，每個Warp Scheduler 可以在每個Warp周期發(fā)起兩條指令；

（4）一個Warp Scheduler內(nèi)有32個單精度CUDA Core。

8、Pascal VS Maxwell

9、Jetson TX1 VS Jetson TX2

10、TX1處理器性能

11、TX1圖形性能

三、ARM Cortex-A57架構(gòu)解析

1、ARM處理器家族

2、ARM Cortex-A57架構(gòu)解析

（1）完全遵循 ARMv8-A 指令集規(guī)范；

（2）超標(biāo)量，可變長度，亂序執(zhí)行流水線；

（3）帶有分支目標(biāo)緩沖（BTB）與全局歷史緩沖（GHB）RAM，一個返回堆棧，以及一個間接預(yù)測器的動態(tài)分支預(yù)測；

（4）AMBA 4 AXI 一致性擴(kuò)展（ACE）或CHI 主機(jī)接口；

（5）實(shí)現(xiàn)了加速器一致性端口（ACP）為AXI4一致性從機(jī)接口；

（6）支持基于ETMv4架構(gòu)的嵌入式跟蹤單元（ETM）;

（7）支持基于PMUv3架構(gòu)的性能監(jiān)控單元（PMU）;

（8）用于多處理器調(diào)試的交叉觸發(fā)接口（CTI）;

（9）通用中斷控制器（GIC）CPU接口。

3、ARM Cortex-A57的性能

4、AArch32 VS AArch64

5、NEON架構(gòu)解析

（1）架構(gòu)分析

（2）NEON數(shù)據(jù)讀取模式

（3）NEON架構(gòu)對比

四、Tegra工作原理與軟件架構(gòu)

1、Tegra 工作原理

2、Tegra中斷控制

（1）一共有0-192號全局中斷，由六個中斷控制器分別管理；

（2）TX1中斷控制器分為兩類：GIC400與LIC；

（3）GIC400是ARM Cortex-A57 的中斷控制器；

（4）LIC是屬于輕量級BPMP處理器的中斷控制器；

（5）任何處理器都可以發(fā)送一個軟件中斷給其它一個或多個處理器（包括自身），但是IPI中斷志限于A57之間（包括自身）；

（6）每個ARM處理器都有兩個引腳來接收IRQ和FIQ中斷，因?yàn)榈碗娖接|發(fā)，因此命名nFIQ和nIRQ；

3、Component 軟件結(jié)構(gòu)

（1）OS Images：JetPack包含來自Ubuntu的樣例文件系統(tǒng)；

（2）Libraries：CUDA Toolkit（Linux下CUDA開發(fā)工具鏈）、TensorRT and cuDNN（高性能深度學(xué)習(xí)應(yīng)用）、VisionWorks and Opencv（視覺計(jì)算應(yīng)用）；

（3）Developer Tools：Tegra Graphics Debugger（調(diào)試OpenGL控制臺級別地工程）、Tegra System Profiler（系統(tǒng)調(diào)試跟蹤分析器，提高CPU效率）、PerfKit（提供訪問GPU性能統(tǒng)計(jì)）、Samples（NVIDIA GameWorks Vulkan 以及 OpenGL 范例）。

4、VisionWorks 軟件結(jié)構(gòu)

五、Jetson 開發(fā)注意事項(xiàng)

1、Jetson 功能概覽

2、Jetson功能布局

3、Jetson注意事項(xiàng)

（1）0-50℃溫度范圍內(nèi)工作；

（2）不同用戶的eMMC、DRAM廠商型號可能不同；

（3）SATA不支持熱插拔；

（4）除了IIC_GPI是3.3V以外，其它的IIC接口都是1.8V接口；

（5）TX1生命期（EOL）至2021年1月（商業(yè)級）；

（6）Jetson TX1只有四核A57,沒有A53；

（7）上電后風(fēng)扇不轉(zhuǎn)，自動風(fēng)扇調(diào)速；

（8）默認(rèn)沒安裝系統(tǒng)，新的模塊上電后無任何反應(yīng)。

4、CUDA開發(fā)注意事項(xiàng)

5、Jetson 開發(fā)注意事項(xiàng)

致謝

1、《Jetson開發(fā)者入門之Tegra架構(gòu)解析》

2、NVIDIA-Jetson_github

全文轉(zhuǎn)自：https://blog.csdn.net/qq_38880380/article/details/79667765

總結(jié)

以上是生活随笔為你收集整理的NVIDIA TX2---Tegra架构介绍的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

编程问答

NVIDIA TX2---Tegra架构介绍

一、Tegra發(fā)展以及各Tegra對比

總結(jié)

一、Tegra發(fā)展以及各Tegra對比