浅析数据质量检查
What are the four broad categories of data quality checks? Provide an implementation technique for each.
數據質量檢查的四大類是什么?為每類提供一種實現技術。
答:數據質量檢查是ETL工作中非常重要的一步,主要關注一下四個方面。
1.正確性檢查(Corret)
檢查數據值及其描述是否真實的反映了客觀事務。例如地址的描述是否完全。
2.明確性檢查(Unambiguous)
檢查數據值及其描述是否只有一個意思或者只有一個解釋。例如地名相同的兩個縣需要加區分方法。
3.一致性檢查(Consistent)
檢查數據值及其描述是否統一的采用固定的約定符號來表示。例如幣別中人民幣用'CNY'。
4.完全性檢查(Complete)
完全性有兩個需要檢查的地方,一個是檢查字段的數據值及其描述是否完全。例如檢查是否有空值。另一個是檢查記錄的合計值是否完全,有沒有遺忘某些條件。
轉載于:https://www.cnblogs.com/sanpoye/archive/2012/03/14/2659616.html
總結
- 上一篇: 华为真全面屏折叠手机现身:开孔、刘海消失
- 下一篇: AMD锐龙处理器越来越贵:均价提升35%