四、数据仓库和Hive环境搭建
生活随笔
收集整理的這篇文章主要介紹了
四、数据仓库和Hive环境搭建
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
上次介紹了HDFS,本來想進入Mapreduce,但感覺Mapreduce基本廢棄,于是直接進入了Hive中來。
數據倉庫
數據倉庫,英文名稱為Data Warehouse,可簡寫為DW或DWH。數據倉庫顧名思義,是一個很大的數據存儲集合,出于企業的分析性報告和決策支持目的而創建,對多樣的業務數據進行篩選與整合。
它為企業提供一定的BI(商業智能)能力,指導業務流程改進、監視時間、成本、質量以及控制。
數據倉庫的輸入方是各種各樣的數據源,最終的輸出用于企業的數據分析、數據挖掘、數據報表等方向。
數據庫和數據倉庫區別
數據庫是面向交易的處理系統,它是針對具體業務在數據庫聯機的日常操作,通常對記錄進行查詢、修改。用戶較為關心操作的響應時間、數據的安全性、完整性和并發支持的用戶數等問題。
數據倉庫一般針對某些主題的歷史數據進行分析,支持管理決策,又被稱為聯機分析處理 OLAP(On-Line Analytical Processing)。
比如,支付寶年度賬單其本質是基于數據倉庫進行數據可視化而成。
數據倉庫,是在數據庫已經大量存在的情況下,為了進一步挖掘數據資源、為了決策需要而產生的,它決
總結
以上是生活随笔為你收集整理的四、数据仓库和Hive环境搭建的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 三、HDFS中的Java和Python
- 下一篇: 生活常识:如何正确使用汽车4S店?