敏捷BI的业务模型是怎样的,为何能替代手动建模?
自助式敏捷BI分析逐漸深入人心,它是一套完整的解決方案,用來將企業中現有的數據進行有效整合,快速準確的提供報表并提出決策依據,幫助企業做出明智的業務經營決策。然而想真正實現企業級業務數據自助分析,搭建好底層業務數據模型,是企業實現BI分析需要做好的第一步,也是至關重要的一步。
本文將以一個簡單的數據分析場景為例,用FIneBI工具,通過兩張零售業務數據表,讓你快速看懂真正的敏捷BI業務模型是如何搭建的。
1.商品定價表:
如下圖所示,存儲商品ID、商品名稱、定價的相關商品字段信息。
2.銷售明細表:
如下圖所示,存儲商品ID、銷售日期、銷量的相關商品銷售信息。
對于這樣的業務數據表,維度表(商品定價表)中同時包含指標信息(定價),如果此時我們需要統計每一個商品對應的銷量情況,對于傳統的BI底層數據建模工具,我們往往會將商品定價表和銷售明細表進行數據表之間的右連接,拼接成數據大寬表。
最終得到如下圖所示的數據寬表,統計每種商品對應的銷量情況。
此時如果僅僅只是統計每個商品對應的銷量情況,那么是沒有任何問題的。但是細心的童鞋們可以觀察上圖中圈紅的部分,由于是根據商品ID進行右連接,那么商品定價表中的定價指標字段自然也會跟著銷售明細表一起進行拓展,那么這樣一來其實在底層存儲的數據中就產生了關于定價的冗余數據。
如下圖所示,此時我們可以通過匯總表統計每個商品的銷量以及定價的情況:
我們通過計算之前的商品定價表和商品銷量表中的數據可以發現,對于商品的銷量統計,是完全沒有問題的。對于商品定價,我們可以看到襯衫、領帶、帽子、皮鞋、運動鞋的定價依次變成了240、300、60、900、750,然而我們清楚地知道,其實領帶、帽子、皮鞋、運動鞋的真實定價應該為80、100、20、300、250。
大家可能會疑惑為什么每種商品的定價都變大了,此時其實我們只需要再增加一個銷售日期的統計口徑便可以觀察出本質原因:
如上圖所示,再加入銷售日期的統計口徑之后,定價就變回正確的定價了。毫無疑問,是由于商品定價表和商品銷量表根據商品ID右連接而產生了定價的冗余數據。
好,說到這里,傳統的BI底層建模在以數據拼接寬表統計多張表的數據關聯時,無疑都難逃此劫(構建的寬表模型會產生冗余數據)。下面來看看真正的敏捷BI業務模型是如何做到快速數據表關聯,而不產生冗余數據的吧。
在取到商品定價表和銷售明細表之后,我們只需要將商品定價表的商品ID和銷售明細表中的商品ID直接進行如下圖所示的1:N關聯即可。
在關聯視圖中可以看到剛剛創建好的如下圖所示的敏捷關聯模型:
此時我們再來統計每個商品對應的銷量和定價,如下圖所示,可以看到所有商品的銷量以及定價全部都被正確統計出來了,完全沒有產生冗余數據。這是因為我們的建立的敏捷BI模型在統計多張數據表時,每張表還是獨立的存儲在底層數據模型之中,只有當需要跨表關聯計算取數時,才會根據關聯的數據表ID進行數據匹配計算,這樣一來,完全保障了底層數據模型的靈活性和可拓展性,除了不產生冗余數據之外,對于大表關聯計算的性能也能夠得到極強的提升。
在準確地得到每個商品的銷量和定價之后,我們可以添加一個銷售額(銷量*定價)指標,快速統計出每個商品對應的總銷售額。
?
歡迎關注我的公眾號“商業智能研究”,私信回復“資料包”,即可領取大數據、數據中臺、商業智能、數據倉庫等6G精華資料!
總結
以上是生活随笔為你收集整理的敏捷BI的业务模型是怎样的,为何能替代手动建模?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 首次曝光的计算模型!对标阿里?有没有想过
- 下一篇: 数据分析不能挣钱、不能给公司创造利润,那