数据中台(二)数据质量分析及提升
一般情況下,企業(yè)都有多套的業(yè)務(wù)系統(tǒng),一些大型企業(yè)甚至?xí)猩习偬椎臉I(yè)務(wù)系統(tǒng)。這些業(yè)務(wù)在不同時期由不同的團隊開發(fā)完成。因此,這些業(yè)務(wù)系統(tǒng)都參考著不同的標(biāo)準(zhǔn)生產(chǎn)各自數(shù)據(jù)。由于濫用縮寫詞,慣用語,數(shù)據(jù)輸入錯誤,重復(fù)記錄,丟失值,拼寫變化,不同的計量單位,大量應(yīng)用系統(tǒng)產(chǎn)生的大量數(shù)據(jù)是臟數(shù)據(jù)。這些臟數(shù)據(jù)是沒有意義的,根本就不可能為以后的數(shù)據(jù)挖掘決策分析提供任何支持。這就是數(shù)據(jù)質(zhì)量問題的由來。
一般來說數(shù)據(jù)質(zhì)量問題有四個因素造成:
從上述的四因素來說,管理因素和流程因素屬于組織管理范疇,信息因素和技術(shù)因素屬于技術(shù)范疇。所以,要改進數(shù)據(jù)質(zhì)量問題,要從組織管理和技術(shù)兩方面入手,才能從根本上,最佳地解決數(shù)據(jù)質(zhì)量問題。
從方法論的角度,從組織管理上去改進質(zhì)量,我們能做的是:
-
確立組織數(shù)據(jù)質(zhì)量改進目標(biāo)
-
評估組織流程
-
制定組織流程改善計劃
-
實施改進
-
評估改善效果
從技術(shù)上去改進數(shù)據(jù)質(zhì)量,我們能做的是?
總結(jié)
以上是生活随笔為你收集整理的数据中台(二)数据质量分析及提升的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 深度学习核心技术精讲100篇(十九)--
- 下一篇: Leetcode每日必刷题库第5题,如何