Hadoop精华问答:Hadoop框架最核心的设计是?
2006年項目成立的一開始,“Hadoop”這個單詞只代表了兩個組件——HDFS和MapReduce。到現在的13個年頭,這個單詞代表的是“核心”,今天我們就來看看關于Hadoop的精華問答。
1
Q:Hadoop是什么?
A:Hadoop是一個由Apache基金會所開發的分布式系統基礎架構。用戶可以在不了解分布式底層細節的情況下,開發分布式程序。充分利用集群的威力進行高速運算和存儲。
Q:Hadoop框架最核心的設計是?
A:HDFS和MapReduce。HDFS為海量的數據提供了存儲,則MapReduce為海量的數據提供了計算。
Q:Hadoop的主要優點?
A:Hadoop的主要優點有以下幾個:
(a) 高可靠性。Hadoop按位存儲和處理數據的能力值得人們信賴。
(b)高擴展性。Hadoop是在可用的計算機集簇間分配數據并完成計算任務的,這些集簇可以方便地擴展到數以千計的節點中。
(c)高效性。Hadoop能夠在節點之間動態地移動數據,并保證各個節點的動態平衡,因此處理速度非常快。
(d)高容錯性。Hadoop能夠自動保存數據的多個副本,并且能夠自動將失敗的任務重新分配。
(e)低成本。與一體機、商用數據倉庫以及QlikView、Yonghong Z-Suite等數據集市相比,Hadoop是開源的,項目的軟件成本因此會大大降低。
Q:HDFS是什么?
A:Hadoop實現了一個分布式文件系統(Hadoop Distributed File System),簡稱HDFS.
HDFS有高容錯性的特點,并且設計用來部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high throughput)來訪問應用程序的數據,適合那些有著超大數據集(large data set)的應用程序。HDFS放寬了(relax)POSIX的要求,可以以流的形式訪問(streaming access)文件系統中的數據。
對外部客戶機而言,HDFS就像一個傳統的分級文件系統。可以創建、刪除、移動或重命名文件,等等。但是 HDFS 的架構是基于一組特定的節點構建的,這是由它自身的特點決定的。
這些節點包括 NameNode(僅一個),它在 HDFS 內部提供元數據服務;DataNode,它為 HDFS 提供存儲塊。由于僅存在一個 NameNode,因此這是 HDFS 的一個缺點(單點失敗)。?
存儲在 HDFS 中的文件被分成塊,然后將這些塊復制到多個計算機中(DataNode)。這與傳統的 RAID 架構大不相同。塊的大小(通常為 64MB)和復制的塊數量在創建文件時由客戶機決定。NameNode 可以控制所有文件操作。HDFS 內部的所有通信都基于標準的 TCP/IP 協議。
Q:HDFS有何特性?
A:HDFS的部分特性:
1. 一致性,高可用性,分區容錯性?
2. 存儲超大文件?
3. 一次寫入,多次讀取(流式數據訪問)?
4. 運行在普通廉價的服務器上?
5. 以高延遲為代價?
6. 不適合存儲大量小容量的文件?
7. 會在多個datanode上存儲多份副本,默認3份,三份副本一般會保存在兩個或者兩個以上的服務器中?
8. namenode 負責管理文件目錄,文件和block的對應關系以及block和datanode的對應關系?
9. datanode負責存儲,大部分的容錯機制都是在datanode上實現
小伙伴們沖鴨,后臺留言區等著你!
關于Hadoop,今天你學到了什么?還有哪些不懂的?除此還對哪些話題感興趣?快來留言區打卡啦!留言方式:打開第XX天,答:……
同時歡迎大家搜集更多問題,投稿給我們!風里雨里留言區里等你~
福利
1、掃描添加小編微信,備注“姓名+公司職位”,加入【云計算學習交流群】,和志同道合的朋友們共同打卡學習!
2、公眾號后臺回復:白皮書,獲取IDC最新數據白皮書整理資料!
推薦閱讀:
輕松了解面試官心理!ElasticSearch寫入數據的工作原理是什么? | 技術頭條
專訪圖靈獎得主John Hopcroft:中國必須提升本科教育水平,才能在AI領域趕上美國
程序員與程序媛的神仙愛情 | 程序員有話說
他曾主導世界上第一臺安卓智能機, 如今能否靠區塊鏈手機找回昔日的光榮?|人物志
移動開發或將被顛覆?
如何將TensorFlow Serving的性能提高超過70%?
喜歡就點擊“在看”吧
總結
以上是生活随笔為你收集整理的Hadoop精华问答:Hadoop框架最核心的设计是?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 马斯克的星链卫星怎么盈利 主要目的就是铺
- 下一篇: Boost:验证atomic <>没有对