什么是大数据,大数据的处理流程介绍
一、大數據是什么?
大數據,bigdata,《大數據》一書對大數據這么定義,大數據是指不能用隨機分析法(抽樣調查)這樣捷徑,而采用所有數據進行分析處理。
這句話至少傳遞兩種信息:
1、大數據是海量的數據
2、大數據處理無捷徑,對分析處理技術提出了更高的要求
二、大數據的處理流程
下圖是數據處理流程:
1、底層是數以千億計的數據源,數據源可以是SCM(供應鏈數據),4PL(物流數據),CRM(客戶數據),網站日志以及其他的數據
2、第二層是數據加工層,數據工程師對數據源按照標準的統計口徑和指標對數據進行抽取、清洗、轉化、裝載(整個過程簡稱ELT)
3、第三層是數據倉庫,加工后的數據流入數據倉庫,進行整合和存儲,形成一個又一個數據集市。
數據集市,指分類存儲數據的集合,即按照不同部門或用戶的需求存儲數據。
4、第四層是BI(商業智能),按照業務需求,對數據進行分析建模、挖掘、運算,輸出統一的數據分析平臺
5、第五層是數據訪問層,對不同的需求方開放不同的數據角色和權限,以數據驅動業務。
大數據的量級,決定了大數據處理及應用的難度,需要利用特定的技術工具去處理大數據。
人工智能、大數據、云計算和物聯網的未來發展值得重視,均為前沿產業,多智時代專注于人工智能和大數據的入門和科譜,在此為你推薦幾篇優質好文:
大數據工程師培訓,需要學習的有哪些課程?
http://www.duozhishidai.com/article-15081-1.html
大數據工程師就業培訓哪個好?
http://www.duozhishidai.com/article-15082-1.html
java大數據與python大數據如何選擇?
http://www.duozhishidai.com/article-12540-1.html
多智時代-人工智能和大數據學習入門網站|人工智能、大數據、物聯網、云計算的學習交流網站
總結
以上是生活随笔為你收集整理的什么是大数据,大数据的处理流程介绍的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: js 中遇到英文双引号后端无法正常存储的
- 下一篇: Docker 配置国内源加速镜像下载