数据挖掘在企业中应用的四种途径
正如修行的省悟過程一樣,要將數據挖掘引入公司,并非只有一種途徑。我們的最終目的是解決企業的業務問題,為企業提供更大的商機。本文簡要介紹了將數據挖掘技術應用到企業中的四種有效途徑。
?
一、購買成熟的模型
?????? 如果企業的問題已經有了現成的解決方案,便沒有必要再去耗費時間和資金去建立一個新的模型了。這個模型的形式可能是一系列的關聯規則,也可能是一個確定了系數的回歸模型,或是一個訓練好了的神經網絡模型——它可以直接應用到實際問題中。我們要做的只是將自己的數據“喂”給它,模型經過自動消化處理,得出一個精簡的答案:諸如哪些老客戶面臨流失的危險?哪些新客戶是最有潛力帶給公司價值的?
這種方法采用了“拿來主義”,是最節省氣力的,不失為一個好辦法。美國的銀行大都采用了信用評估系統,當客戶遞交貸款申請后,該系統根據用戶填寫的一大串資料快速對客戶信用風險做出預測。實際表明,該系統能夠大大提高工作的效率,而且效果也不會遜于信貸員的經驗判斷。但是,這種評分機制將眾多不同的數據濃縮為一個結果,很多細節上的差別無疑被忽視了——客戶信用評分高或低的具體原因沒有被體現出來。
另外,這種方便、快捷的方法也極其缺少靈活性:如果使用的條件發生了變化,模型難以隨之做出改動。因此,必須要注意使用購買模型的先決條件:你目前的形式包括產品、市場、客戶關系等必須和該模型當初建立時的假設是一致的。盲目生搬硬套,勢必會產生毫無價值甚至荒謬的結果,一旦不經意的應用,危害就難說了。
?
二、使用行業應用軟件
?????? 顧名思義,行業應用軟件是為某一行業領域量身定做的。從底層的數據分析處理一直到頂層的交互界面都是結合特定行業的業務流程和專業特色來設計、開發的。雖然它的應用領域比較狹窄,但較之直接購買的模型,它可以更多的融入和結合人的判斷,提高了靈活性。而且,相對于通用數據挖掘軟件,它能夠很好的利用專業領域的各種知識。
?????? 目前比較流行的客戶流失管理軟件,被電信、超市、電子商務等許多不同類型的企業所應用,他們共同的目標是為了提前發現有可能流失的客戶群,及時反應,做出相應的挽留措施。此類軟件可以結合企業自身的規模、用戶、產品、交易額、市場環境、挖掘目標等具體條件來控制和實施數據挖掘的過程。
通常,行業應用軟件里嵌入了多個建模的模板,使用向導的方式輔助用戶完成模型的建立,然后從中選取最優。其實,這種“最優選擇”也只是相對的,因為輔助建模的過程是僵硬的,它無法完成數據挖掘中最重要的部分,包括正確理解和定義商業問題、將有用的數據挑選出來轉換為潛在的信息、對建模結果進行理性的解釋和評價。
固然,這類軟件采用了專業領域的表達方式和解決特定問題的用戶界面,從而易于理解而且自動性高,使實施的過程變得相對簡單。但是,如果你的企業擁有更加復雜的數據和更加具體的挖掘目標,就需要采用更加高級的數據挖掘方法了。
?
三、聘請專家實施項目
?????? 他山之石,可以攻玉。如果數據挖掘并非只是為了解決眼前的問題,而是著眼于企業長遠的成長;如果企業的數據來自眾多系統,格式復雜也并非純凈;如果不明確如何利用挖掘的成果創造新的商機;如果企業內部的成員沒有足夠的能力保證項目的順利實施——此時,聘請外部專家來引導數據挖掘項目走向成功,才是明智的選擇。
?????? 你可以聯系數據挖掘軟件銷售商(諸如SAS、SPSS、Miner等),邀請數據挖掘工程師帶著功能強大(操作同樣復雜)的數據挖掘軟件來到企業,將他們的專業知識應用到企業的數據挖掘過程中;你也可以帶著企業的數據到高校或咨詢公司等數據挖掘中心,利用他們的軟件和硬件,和他們一起工作。
如本文開始所言,數據挖掘的過程絕非一蹴而就,而是如同僧人的修行省悟,可能漫長而反復。建模方法千變萬化,而數據靜靜的呆在那里,十足一副以不變應萬變的姿態。這里有條條大路,但并非都能通向羅馬,為了找到最有效的模型,我們通常需要反復檢驗,做出選擇。一般存在以下幾個決定性的步驟需要放慢腳步,仔細考察:首先,根據現有的人力、物力選取建模工具;其次,根據數據的特點對模型分類,制定標準來拆分數據,從而建立不同的模型;然后,調整參數,從決策樹、神經網絡等算法中選取最有效的建立最終模型;另外,建模過程中要具體問題具體分析,有效的抽取、清洗、轉換、重組數據。
需要強調的是,在這個過程中一定要注意企業人員和挖掘人員之間的溝通和協調,才能將企業積累的商業智慧和挖掘人員的專業知識完美結合。
??????
四、量身定做開發自己的數據挖掘平臺
?????? 由于商業問題的特殊性,數據挖掘工具并非像某些促銷廣告所言:“總有一款適合您”。通過考察企業問題的特殊性,對購買軟件、聘請專家所需要的投資和挖掘成果應用后可能帶來的回報等因素進行綜合比較,你也可以考慮開發一個適合自身環境的數據挖掘工具。雖然可能會花去較長的時間,但成功之后,受益久遠。這個量身定做的數據挖掘工具可以隨時根據企業環境的變化做出修正和調整,并且有堅實的技術支持作為保障。
?????? 這類狀況在商業范圍內比較少見,通常在醫藥、體育等自身數據差異較大、數據挖掘研究尚不全面成熟的領域使用。主要表現為走進高校,和具有專業知識的導師及其研究生小組互動完成。
????? 以上方法的選擇由企業環境所決定,可以選其一,也可以將幾種方法捆綁起來,優勢互補。最后還要強調兩點:第一,并非所有的軟件都能完全實現自動化,也并非所有的軟件都能取代人的智慧,如果沒有專業的數據挖掘技能,即使數據挖掘工具的功能再強大,也很難產生好的結果。所以,必須有數據挖掘領域的專家參與,以人為本,才能保證企業數據挖掘流程沿著安全、有效的軌道進行。第二,企業自身遠比外部更了解自己的業務和客戶,最好的方法是在企業內部培養數據挖掘骨干人員——只有同時做到精通企業問題和數據分析方法,才能將數據挖掘的效用發揮到極致。
與50位技術專家面對面20年技術見證,附贈技術全景圖總結
以上是生活随笔為你收集整理的数据挖掘在企业中应用的四种途径的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 大学计算机软件专业生应该学什么(转)
- 下一篇: 商务智能