Hbase总结(三)-Hbase与Hive的区别与联系
問題導讀:
hive與hbase的底層存儲是什么?
hive是產生的原因是什么?habase是為了彌補hadoop的什么缺陷?
共同點:
1.hbase與hive都是架構在hadoop之上的。都是用hadoop作為底層存儲
區別:
2.Hive是建立在Hadoop之上為了減少MapReduce jobs編寫工作的批處理系統,HBase是為了支持彌補Hadoop對實時操作
的缺陷的項目 。
3.想象你在操作RMDB數據庫,如果是全表掃描,就用Hive+Hadoop,如果是索引訪問,就用HBase+Hadoop 。
4.Hive query就是MapReduce jobs可以從5分鐘到數小時不止,HBase是非常高效的,肯定比Hive高效的多。
5.Hive本身不存儲和計算數據,它完全依賴于HDFS和MapReduce,Hive中的表純邏輯。
6.hive借用hadoop的MapReduce來完成一些hive中的命令的執行
7.hbase是物理表,不是邏輯表,提供一個超大的內存hash表,搜索引擎通過它來存儲索引,方便查詢操作。
8.hbase是列存儲。
9.hdfs作為底層存儲,hdfs是存放文件的系統,而Hbase負責組織文件。
10.hive需要用到hdfs存儲文件,需要用到MapReduce計算框架。
問題導讀:
hive與hbase的底層存儲是什么?
hive是產生的原因是什么?habase是為了彌補hadoop的什么缺陷?
共同點:
1.hbase與hive都是架構在hadoop之上的。都是用hadoop作為底層存儲
區別:
2.Hive是建立在Hadoop之上為了減少MapReduce jobs編寫工作的批處理系統,HBase是為了支持彌補Hadoop對實時操作
的缺陷的項目 。
3.想象你在操作RMDB數據庫,如果是全表掃描,就用Hive+Hadoop,如果是索引訪問,就用HBase+Hadoop 。
4.Hive query就是MapReduce jobs可以從5分鐘到數小時不止,HBase是非常高效的,肯定比Hive高效的多。
5.Hive本身不存儲和計算數據,它完全依賴于HDFS和MapReduce,Hive中的表純邏輯。
6.hive借用hadoop的MapReduce來完成一些hive中的命令的執行
7.hbase是物理表,不是邏輯表,提供一個超大的內存hash表,搜索引擎通過它來存儲索引,方便查詢操作。
8.hbase是列存儲。
9.hdfs作為底層存儲,hdfs是存放文件的系統,而Hbase負責組織文件。
10.hive需要用到hdfs存儲文件,需要用到MapReduce計算框架。
總結
以上是生活随笔為你收集整理的Hbase总结(三)-Hbase与Hive的区别与联系的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: HBase总体介绍
- 下一篇: Hbase总结(四)- Hbase与传统