多元统计分析matlab,matlab与应用多元统计分析..doc
多元統計分析中的應用研究
,
摘要:許多實際問題往往需要對數據進行統計分析,建立合適的統計模型,過去一般采用
SAS 、SPSS軟件分析,本文給出 Matlab軟件在多元統計分析上的應用, 主要介紹Matlab在聚類分析、判別分析、主成份分析上的應用,文中均給以實例, 結果令人滿意。
關鍵詞:Matlab軟件;聚類分析;主成份分析
Research for application of Multivariate Statistical Analysis
Abstract:Many practice question sometimes need Statistical Analysis to data.,and establish appropriate Statistical model SAS and SPSS software were commonly used in foretime ,this paper give the application of Matlab software in Multivariate Statistical Analysis,mostly introduce the application of Matlab software in priciple component analysis and cluster analysis and differentiate analysis.The example are given in writing and the result are satisfaction.
Key words: Matlab software; cluster analysis; priciple component analysis
0 引言
許多實際問題往往需要對數據進行多元統計分析, 建立合適的模型, 在多元統計分析方面, 常用的軟件有SAS 、SPSS 、S-PLUS等 。我們在這里給出Matlab在多元統計分析上的應用, 在較早的版本中, 統計功能不那么強大, 而在Matlab6.x版本中, 僅在統計工具中的功能函數就達200多個, 功能 已 足 以 趕超任何其他專用的統計軟件,在應用上Matlab具有其他軟件不可比擬的操作簡單,接口方便, 擴充能力強等優勢, 再加上Matlab的應用范圍廣泛, 因此可以預見其在統計應用上越來越占有極其重要的地位,下面用實例給出Matlab在聚類分析、主成份分析上的應用。
1 聚類分析
聚類分析法是一門多元統計分類法,其目的是把分類對象按一定規則分成若干類,所分成的類是根據數據本身的特征確定的。聚類分析法根據變量(或樣品或指標)的屬性或特征的相似性,用數學方法把他們逐步地劃類,最后得到一個能反映樣品之間或指標之間親疏關系的客觀分類系統圖, 稱為譜系聚類圖。
聚類分析的步驟有:數據變換,計算n個樣品的兩兩間的距離,先分為一類,在剩下的n-1個樣品計算距離,按照不同距離最小的原則,增加分類的個數,減少所需要分類的樣品的個數,循環進行下去,直到類的總個數為 1 時止。根據類之間的距離,畫出譜系聚類圖。
我們對杭州所轄張家港市2005年七條河流中主要污染因子(指標)即CODmn,BOD5, 非離子氨,氨氮,揮發酚, 石油類共6個變量(資料見表1, 來源于張家港市2003年環境質量報告書) ,進行聚類分析。
表1 港2005年七條河流主要污染因子
河流CODmnBOD5非離子氮氨氮揮發酚石油類類型張家港河
二干河
東橫河
橫套河
四干河
華妙河 鹽鐵塘3.14
5.47
3.1
5.67
6.81
6.21
4.878.41
9.57
4.31
9.54
9.05
7.08
8.9723.78
26.48
21.2
10.23
16.18
21.05
26.5425.79
23.79
22.48
20.87
24.56
31.56
34.564.17
6.42
5.34
4.2
5.2
6.15
5.586.47
5.58
6.54
6.8
5.45
8.21
8.073
1
3
1
1
2
2
我們利用Matlab6.5中的cluster命令實現,具體程序如下
3.14
5.47
3.1
5.67
6.81
6.21
4.878.41
9.57
4.31
9.54
總結
以上是生活随笔為你收集整理的多元统计分析matlab,matlab与应用多元统计分析..doc的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 2019java后端面试集合篇最值得收藏
- 下一篇: 计算机网络原理的思维导图汇总