大专计算机应用技术答辩,计算机应用技术专业硕士答辩.ppt
計算機應用技術專業碩士答辯
* 基于密度和中心點的分布式數據流聚類算法的研究 姓 名:侯杰 學 號:Y專 業:計算機應用技術 研究方向:數據挖掘與分布式計算 指導老師:高宏賓 報告內容 主要研究內容 計劃步驟 對聚類算法的初步研究 高維數據流降維 后期擬完成的研究工作及進度安排 1.主要研究內容 分布式聚類算法的研究 基于密度和中心點的聚類方法研究 高維數據流的降維處理 2.計劃步驟 序號 階段及內容 起訖日期 階段成果形式 [1] 論文全過程 2010.11-2012.04 [2] 確定研究項目,查閱相關文獻資料,進行開題 2010.11-2011.01 已結束 [3] 研究分布式數據流聚類相關算法 2011.01-2011.03 研究了經典的DBSCAN、k-means算法 [4] 研究密度和中心點在分布式數據流聚類中的相關算法 2011.03-2011.06 未正式開始 [5] 高維數據流降維技術的研究 2011.06-2011.10 數據流預處理階段已經基本結束 [6] 1.綜合整理研究項目,完成算法與測試數據 2.總結項目 2011.10-2011.12 [7] 總結研究成果,完成論文 2011.12-2012.04 表1 開題報告計劃表 T KPCA降維 數據 開始 高維數據? 低維數據 尋找核心對象集 過濾不符合閾 值的候選對象 尋找完畢? 廣度優先算法BSF 完成 F F T 圖1 論文整體流程圖 3.對聚類算法的初步研究 目前已經對經典的k均值算法和DBSCAN算法做了初步研究,計劃在此基礎上研究基于密度和中心點的分布式聚類算法。 圖2 K均值圖示 圖3 DBSCAN圖示 4.高維數據流降維 本部分在近期占用時間較多,已經就“基于核主成分分析的數據流降維研究 ”完成期刊論文,目前正在修改中,該部分作為數據流的預處理部分在整篇論文中具有重要作用。 1.核方法 數據空間 線性操作: PCA、分類、線性回歸等 非線性操作: KPCA、SVM、SVR等 核方法 特征空間 特征空間回歸 到數據空間 2.核函數 3.分組的核主成分分析(GKPCA) 圖4 降維方法與效果圖示 對于測試結果,由于所選的數據集較小,又采取了 一個實驗,對算法的性能方面沒有過硬的說服力, 目前已經對該問題進行了補充。 表2 測試樣例的降維結果 實例數*維數 189*13 378*13 567*13 756*13 945*13 1134*13 1323*13 PCA 189*11 378*11 567*11 756*11 945*12 1134*12 1323*12 KPCA 189*9 378*9 567*9 756*9 945*9 1134*10 1323*10 GKPCA 84*7 169*8 266*8 346*8 429*8 481*8 579*9 圖5 時間消耗圖 5.后期擬完成的研究工作及進度安排 重點研究“基于密度和中心點的聚類算法” 分布式環境下的數據流聚類(Hadoop) 論文的組織與撰寫,計劃在歲末完成論文初稿,2012年完成碩士論文畢業答辯 圖6 HDFS 結構 * * * * * * * * * * * * * * * * * * *
總結
以上是生活随笔為你收集整理的大专计算机应用技术答辩,计算机应用技术专业硕士答辩.ppt的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: ci php做记录删除,CI(CodeI
- 下一篇: jdk1.8要安装什么mysql_Win