【数据挖掘】数据挖掘简介 ( 6 个常用功能 | 数据挖掘结果判断 | 数据挖掘学习框架 | 数据挖掘分类 )
文章目錄
- I . 數據挖掘 功能
- II . 數據挖掘 結果判斷
- III . 數據挖掘 學習框架
- IV . 數據挖掘 分類
I . 數據挖掘 功能
1 . 概念描述 ( Concept Description ) : 主要進行 表征 與 判斷 操作 , 概括 , 總結 , 對比 數據的特征 ;
如 : 對產品分類 , 對真實世界進行描述 ;
2 . 關聯分析 ( Association ) : 分析兩個事物的發生的 相關性 , 因果性 ;
如 : 尿布 與 啤酒 經常被一起購買 ( 相關性分析 ) ; 銀行對申請貸款的人的信用評級進行相關性分析 ;
3 . 分類和預測 ( Classification and Prediction ) : 數據挖掘中的重要部分 , 構造用于 描述 / 區分 對 未來預測 的 分類 / 概念 的模型 ;
有監督學習過程 : 分類和預測是典型的有監督學習的過程 , 先給一組訓練數據 , 根據該數據進行訓練 , 完成后對未知的數據進行預測 ;
如 : 預測票房 , 疾病 ; 預測未知數值 ; 根據氣候對國家分類 ; 根據汽車油耗對汽車分類 ;
4 . 聚類分析 ( Cluster Analysis ) : 將數據分組 , 使類內部數據相似度最大化 , 使類之間數據的相似度最小化 ;
數據類型標簽未知 : 將數據分組形成新類 , 分析找出分類的依據 ;
5 . 異常檢測 ( Outlier Analysis ) :
① 異常值 ( Outlier ) : 不符合一般行為特點的數據 ;
② 異常值作用 : 該數據很重要 , 用于罕見事件分析 , 欺詐檢測 ;
6 . 趨勢與演化分析 ( Trend and Evolution Analysis ) : 趨勢與偏差 , 如回歸分析 ; 序列模式挖掘 , 周期性分析 ; 基于相似性的分析 ;
II . 數據挖掘 結果判斷
數據挖掘結果判斷 : 數據挖掘得出的 知識 / 模式 , 如何判斷得出的結果是否有效 ;
① 客觀判斷方法 : 通過科學計算進行判斷是否正確 , 該計算基于 模式 的t 統計和結構 ; ( 學術界判斷 )
② 主觀判斷方法 : 基于人的個人感覺 , 根據該結果是否盈利 , 客戶 ( 甲方 ) 給出評判結果 ; ( 工業界判斷 )
III . 數據挖掘 學習框架
1 . 數據挖掘技術 ( 重點 ) : 聚類分析 , 異常檢測 , 分類 , 關聯規則分析 , 序列模式分析 , 數據方體與數據倉庫 ;
2 . 數據挖掘原理 : 數據庫技術 ( 索引 , 數據壓縮 , 數據結構 ) , 人工智能 , 機器學習 , 統計學 , 信息論 , 理論計算 ( 近似 / 隨機 算法 ) , 數學規劃 , 幾何計算 ;
3 . 數據挖掘應用 : CRM , 搜索分析 , 網絡安全 , 生物信息分析 …
IV . 數據挖掘 分類
1 . 根據輸入數據類型分類 :
① 根據 數據模型 分類 : 根據數據模型分類 , 分類成 關系 , 面向對象 , 對象 - 關系 , 數據倉庫 等不同類型的數據模型的 數據挖掘 ;
② 根據 數據類型 分類 : 時間數據 , 空間數據 , 文本數據 , 音視頻多媒體數據 , WEB 數據 等類型的數據挖掘 ;
2 . 根據輸出數據類型分類 :
① 根據結果類型分析 : 特征分析 , 關聯分析 , 聚類分析 , 偏差分析 , 異常檢測分析 , 趨勢和演化分析 等類型的 數據挖掘 ;
② 根據挖掘的知識的粒度與抽象級別分類 : 高抽象的泛化知識 , 原始層的知識 , 多層的知識 ;
3 . 根據采用的技術分類 : 如 機器學習 , 模式識別 , 神經網絡 , 可視化 等技術類型的 數據挖掘 ;
4 . 根據應用領域分類 : 如 金融 , 生物 , 電訊 等領域的數據挖掘 ;
總結
以上是生活随笔為你收集整理的【数据挖掘】数据挖掘简介 ( 6 个常用功能 | 数据挖掘结果判断 | 数据挖掘学习框架 | 数据挖掘分类 )的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【设计模式】适配器模式 ( 类适配器代码
- 下一篇: 【设计模式】享元模式 简介 ( 定义 |