胖子哥的大数据之路(二)- 大数据结构化数据存储应用模式
一、楔子
胖子哥是我網(wǎng)名,叫了很多年的網(wǎng)名,網(wǎng)名的來歷與自己的滄桑和身材有關(guān),不知是IT改變了我,顯得蒼老,還是我本就蒼老,順應(yīng)了IT行業(yè)的需要。25歲那面,曾被跟我一樣高的漂亮美眉叫叔叔,從此再也不敢打小姑娘的注意,走上了重口味熱愛阿姨級別女性的不歸路;曾被三十五、六歲的同事阿姨說蒼老:看你也就三十五六吧,那年我25;周一的時候,還有一個60后的同事問及我的年齡,他很含蓄的,明顯帶著保留的口吻問我:你是75年的吧?因為他一直認(rèn)為和我一般大。然后...然后淚奔。關(guān)于體型方面也是個悲劇、三圍相等,體重大于身高的角色,算是已經(jīng)胖出了一定層次,每次聽到別人叫我胖子,就感覺小小的自尊多少受到了傷害,然后就給自己在后面加了一個哥子,算是給自己遮半張臉吧。閑話就聊到這里,還是繼續(xù)胖子哥的大數(shù)據(jù)之路吧,這次要談的還是數(shù)據(jù)倉庫。
二、實時查詢數(shù)據(jù)庫-HDFS&HBase
傳統(tǒng)關(guān)系型數(shù)據(jù)庫基于存儲模式的問題帶來的存儲和訪問瓶頸,是無法靠自身解決的,也就有了基于Big-Table型的NoSQL數(shù)據(jù)庫用武之地,比較典型技術(shù)組合就是HDFS+HBase,利用HDFS的分布式、高可用數(shù)據(jù)存儲,結(jié)合HBase面向列的數(shù)據(jù)存儲模型,從而解決大數(shù)據(jù)量存儲的問題;結(jié)合HBase基于Rowkey自然序的存儲,從而實現(xiàn)海量數(shù)據(jù)快速查詢。當(dāng)然這種模式只適用于結(jié)構(gòu)型數(shù)據(jù),而且只適用于歷史數(shù)據(jù)查詢,而不適用于事務(wù)型業(yè)務(wù)的處理,從而產(chǎn)生了大數(shù)據(jù)在結(jié)構(gòu)化數(shù)據(jù)存儲方面的第一種模式:實時查詢數(shù)據(jù)庫;
三、大數(shù)據(jù)倉庫-HDFS&Hive
基于關(guān)系型數(shù)據(jù)庫的數(shù)據(jù)倉庫,同樣面臨數(shù)據(jù)存儲規(guī)模的問題,因此在銀行業(yè)務(wù)中,同樣也只能存儲短期的數(shù)據(jù),其目標(biāo)在在于支持基于業(yè)務(wù)年度的報表統(tǒng)計和業(yè)務(wù)分析,而對于超過一定期限的數(shù)據(jù)仍然在走數(shù)據(jù)磁盤或磁帶存儲的模式。基于大數(shù)據(jù)技術(shù)體系,采用HDFS+Hive的模式,構(gòu)建大數(shù)據(jù)倉庫,則可以很輕松的解決數(shù)據(jù)大基數(shù)存儲的問題。從而產(chǎn)生了大數(shù)據(jù)在結(jié)構(gòu)化數(shù)據(jù)數(shù)據(jù)存儲方面的第二種模式:大數(shù)據(jù)倉庫;
四、替換還是互補-大家來回答,期待你的答案
問題一
實時查詢數(shù)據(jù)庫能否替換實時操作數(shù)據(jù)庫嗎?
問題二
大數(shù)據(jù)倉庫可以替代數(shù)據(jù)倉庫嗎?
五、關(guān)于大數(shù)據(jù)題外話
曾經(jīng)就干貨與濕貨的問題,與人發(fā)生過爭辯,還是不淡定了。其實對于一個口渴的人,水就是干貨,同樣,對于一個迷路的人,指南針就是干貨。見仁見智的事,不再做爭辯。重在分享,送給大數(shù)據(jù)傳統(tǒng)企業(yè)應(yīng)用實施的探路者們,送給需要的人,立此存照。
持續(xù)更新中,未完待續(xù)。。。。
下期預(yù)告:大數(shù)據(jù)倉庫項目的需求分析該如何去做。敬請期待。
總結(jié)
以上是生活随笔為你收集整理的胖子哥的大数据之路(二)- 大数据结构化数据存储应用模式的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: CHIP-seq 分析笔记
- 下一篇: 极路由1 1s 2 3 刷机 / 恢复