(商务智能第七章)
文章目錄
- 8 多維建模
- 1 :維度建模中的基本概念
- ①:事實表
- ②:維度表
- ③:維度屬性和度量值的區別
- ④:事實和維度的融合
- 2:零售營銷
- ①:維度建模的設計過程
- 一:需求分析
- 二:定義業務處理的粒度
- 三:選定維度
- 四:維度的設計
- 五:POS事務編號
8 多維建模
1 :維度建模中的基本概念
①:事實表
| 日期關鍵字(FK) |
| 產品關鍵字(FK) |
| 商場關鍵字(FK) |
| 銷售額 |
| 銷售量 |
- 維度建模的核心和基本表
- 每一個事實表都對應著一個或者是若干個“度量值”
- 度量值是事實表的核心,也是趨勢分析的對象
- 通過事實表來記錄維度值和度量值之間的關系
- 事實表中的一行對應一個度量值
- 事實表中的所有度量值必須具有相同的粒度
- 粒度劃分的模型:事務,周期快照,累計快照
- 事實表中的度量值
- 最常用的度量值:數值類型
- 度量值通場是一個可以連續取值的量,很少采用文本形式的度量值
- 三種類型的度量值
- 做加發,沿著某些維度做加法,不能做加法運算
- 計數統計,計算平均值,取樣統計
- 事實表中的關鍵字
- 每個事實表中都有兩個或者是兩個以上的外關鍵字
- 通過外關鍵字建立事實表和為表之間的練習,從而可以通過維度表來存取事實表中的度量值
- 可以由外關鍵字的組合構成事實表中的主關鍵字
- 每個事實表中都有兩個或者是兩個以上的外關鍵字
②:維度表
- 維度表是事實表的入口,為用戶提供了使用數據倉庫的接口
- 維度表中的維度屬性筒倉用于定義事實表上的查詢條件,也可作為定義報表和統計查詢的“列”
- 維度表的定義通常包括
- 盡可能多的列
- 相對少的行(相對于事實表)
- 維度表的屬性組成
| 產品描述 |
| SKU編號 |
| 商標編號 |
| 分類描述 |
| 部門描述 |
| 包裝描述 |
- 維度屬性
- 通常是文本數據,或者是離散數據
- 盡量減少使用編碼屬性(使用一月,而不是用1)
③:維度屬性和度量值的區別
- 度量值屬性
- 由許多的取值可能并可以參與統計運算的屬性
- 維度屬性
- 離散的或者是取值可能不是很多的屬性
- 取值不變或者很少產生變化的屬性
- 從不參與統計計算但是經常用作查詢條件的屬性
④:事實和維度的融合
- 將事實表及其相關的維表通過關鍵字進行連接
2:零售營銷
①:維度建模的設計過程
- 選取要建模的業務處理過程(分析型)
- 分析需要
- 定義業務處理的粒度
- 事實表中的每一行的度量值的取值粒度
- 選擇事實表中的維度(事先已經建立)
- 選擇事實表中的度量值
- 以分析對象為依據
- 可以由多個度量值
一:需求分析
- 數據的入口(數據驅動)
- 前臺的pos機
- 后臺的貨物入庫
- 管理決策需要(面向主題)
- 定價
- 促銷
- 這是兩個最常見也是最重要的決策
二:定義業務處理的粒度
- 選取業務處理
- 在什么樣的促銷條件下,在什么樣的日子里,在什么樣的商店,正在銷售什么樣的商品
- 定義粒度
- POS事務的每個商品條目
- 最初粒度的選擇可以與執行的分析操作有關系
三:選定維度
- 先選取已經確定的維表,與自己的事實表聯系
- 確定待定事實
- 通過計算而獲得的可加性的度量值也可以物理存儲在事實表中(毛利潤金額)
- 不具有可加性的計算結果則應該由分析展現工具在訪問過程中進行計算,比如(毛利潤,單價)
四:維度的設計
- 日期維度
- 是每個數據倉庫必須具備的維度
- 日期維度表可以實現的建立好
- 可以預先建立好五到十年的日期維度值
- 日期是客觀存在的,是可以預見的,預先建立可以保證不漏不重,同時連續的物理存儲空間增加效率
- 日期維度中的屬性
- 星期,月名,嫉妒,財政周
- SQL日期標記(用于sql數據庫的連接,用于加速)
- 產品維度
- 產品維度表中存在著兩類的屬性
- 產品的多級體系劃分屬性(構成屬性體系結構)
- SKU編號 -> 小類描述 -> 大類描述 -> 部門描述
- 從左到右,每一級都是多對一的對應管理,從而構成了一個關于商品的分類體系
- 其他的描述屬性
- 包裝類型,脂肪含量
- 這類屬性并不是產品體系中的組成部分,但是可以與產品的體系劃分屬性組合在一起進行有意義的分析應用
- 產品維度表中存在著兩類的屬性
- 商場維度
- 銷售面積
- 數值類型的字段,并且是跨商場可相加的
- 但是由于這是商場的一個不變屬性,并且大都用作查詢分析報表的列標題,所以還是安排在商場維度表中
- 首次開業日和最后一次重修日期
- 其取值來自于定義在前述的日期維度表上的視圖
- 采用維度支架加以實現
- 首場開業日期和最終的重修日期一般都是要連接到日期維度表拷貝的關鍵字,這些日期維度的拷貝通過VIEW結構在SQL進行定義,并且在語義上同基本日期維度相區別
- 銷售面積
- 促銷維度
- 對商品促銷活動的評判因素
- 促銷商品的銷售分析
- 在促銷期間是否出現增長
- 在促銷進行之前或者是隨后是否減少
- 相鄰或者是同類的其他商品的銷售是否出現相應的降低情況
- 與促銷商品的同類的所有商品的銷售是否出現總體增長
- 促銷是盈利(考慮促銷活動自身的成本)
- 促銷商品的銷售分析
- 存在多種不同的促銷形式
- 降價,廣告,展銷,
- 每一種類型的促銷活動可以單獨形成一個促銷維度表
- 也可以將所有的促銷活動柔和在一個促銷維度表種
- 維度的組合
- 參與組合的維度高度相關,組合起來的維度就不會比分開的維度大許多
- 組合起來的維度能夠高效的進行瀏覽
- 維度的分散
- 在用戶分開考慮的時候,分開的維度更加容易理解
- 獨立維度的管理對于組合維度來說,更加的直接了當
- 不在促銷范圍之內的商品銷售事實應該如何在事實表中表示
- 在促銷維度表中定義一個特殊的行
- 在事實表中,所有沒有參與促銷活動的行(產品銷售事實)都引用該特殊的行,以表示該維度只對事實表中的當前行不可用
- 還有一類問題是上述的零售營銷模型無法回答的(什么樣的促銷產品是還沒有賣出去的)
- 需要另外一個非事實型事實表來記錄每件商品的促銷活動
- 促銷范圍事實表
- 不存在度量指標(僅僅記錄各個維成員之間的關系)
- 為每天中的每個商場的每一個促銷產品創建一行
- 需要另外一個非事實型事實表來記錄每件商品的促銷活動
- 對商品促銷活動的評判因素
| 促銷名稱 | |
| 減價類型 | |
| 促銷媒體類型 | |
| 廣告類型 | |
| 展覽類型 |
五:POS事務編號
- 退化維度
- 維度表為空,具體的維度值直接存放在事實表中
- 事務編號,訂單編號,發票編號,提貨單編號
總結
- 上一篇: (操作系统实验)第四次说明
- 下一篇: 2020 操作系统第三天复习(知识点总结