这Hadoop分布式文件系统
生活随笔
收集整理的這篇文章主要介紹了
这Hadoop分布式文件系统
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
? ?Hadoop帶有一個分布式的文件系統叫做HDFS,它代表Hadoop分布式的文件系統。HDFS是Hadoop的標準性文件系統。
? ?這HDFS的設計
? HDFS是一個為了使用流數據存儲大量文件的文件系統,運行在硬件簇。
? 流數據獲得:
? ?HDFS被建立大部分有效的數據處理模式是寫一次和多次讀寫。一個數據基本上產生或者拷貝從源,然后各種分析被執行在那數據。每一次分析都涉及大量的部分,讀取真個數據表的時間是更重要的比著傳統的讀第一個記錄。
? ?標準硬件
? Hadoop并不需要昂貴和高可靠性的硬件來運行。它被設計運行在標準的硬件對于那些節點失敗的機會是很高的,至少對大量的簇。HDFS被設計來運行工作沒有一個通知打斷在面對這樣的失敗。
? 它是值得檢查對于使用HDFS的應用程序并沒有工作很好。當這可能改變在未來,在這些地方HDFS并不適合。
? ? 低-延遲的數據獲得
? ?需要低-延遲獲得的數據的應用程序,例如幾十毫秒的范圍,不適合HDFS在運行。
? ? 大量的小文件:
? ? 因為這namenode擁有文件系統的屬性數據在內存中,這下載了在一個文件系統的文件數量有在namenode的大量內存大管理。
? ? ?多重的寫者,任意的文件修改
總結
以上是生活随笔為你收集整理的这Hadoop分布式文件系统的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 字符串移位
- 下一篇: Hadoop的分布式文件系统