多元统计分析基于r课后答案_多元统计分析课后练习答案与解析
專業知識整理分享
第
1
章
多元正態分布
1
、在數據處理時,為什么通常要進行標準化處理?
數據的標準化是將數據按比例縮放,
使之落入一個小的特定區間。
在某些比
較和評價的指標處理中經常會用到,
去除數據的單位限制,
將其轉化為無量綱的
純數值,便于不同單位或量級的指標能夠進行比較和加權。其中最典型的就是
0-1
標準化和
Z
標準化。
2
、歐氏距離與馬氏距離的優缺點是什么?
歐氏距離也稱歐幾里得度量、歐幾里得度量,是一個通常采用的距離定義,
它是在
m
維空間中兩個點之間的真實距離。
在二維和三維空間中的歐氏距離的就
是兩點之間的距離。
缺點:
就大部分統計問題而言,
歐氏距離是不能令人滿意的。
每個坐標對歐
氏距離的貢獻是同等的。
當坐標表示測量值時,
它們往往帶有大小不等的隨機波
動,
在這種情況下,
合理的方法是對坐標加權,
使變化較大的坐標比變化較小的
坐標有較小的權系數,
這就產生了各種距離。
當各個分量為不同性質的量時,
“距
離”
的大小與指標的單位有關。
它將樣品的不同屬性之間的差別等同看待,
這一
點有時不能滿足實際要求。沒有考慮到總體變異對距離遠近的影響。
馬氏距離表示數據的協方差距離。
為兩個服從同一分布并且其協方差矩陣為
Σ的隨機變量與的差異程度
:
如果協方差矩陣為單位矩陣
,
那么馬氏距離就簡化
為歐氏距離
,
如果協方差矩陣為對角陣
,
則其也可稱為正規化的歐氏距離。
優點:
它不受量綱的影響,
兩點之間的馬氏距離與原始數據的測量單位無關。
由標準化數據和中心化數據計算出的二點之間的馬氏距離相同。
馬氏距離還可以
總結
以上是生活随笔為你收集整理的多元统计分析基于r课后答案_多元统计分析课后练习答案与解析的全部內容,希望文章能夠幫你解決所遇到的問題。