基 于 主 成 分分 析 和 灰 色 聚 类 对 我 国 居 民 收 入 差 距 分 析(陈 宝 平)
作者:陳 寶 平
筆記:30各地區(qū)?行 業(yè) 的 平 均 工 資;
采 用 主 成 分 分析 對 每 個 地區(qū)1 0 年 的 泰 爾 指 數 降 維, 轉 化 成 三 個 主 成 分 因 子;
通 過 灰色 聚 類 分析 主 成 分 得 分 矩 陣 , 將30 個 地 區(qū) 劃 分 為 三 類;
居 民 收 入 從 東 部 到 西 部 遞 減 , 具 有 明 顯 的 區(qū) 域 性 、 集 聚 性 特 點。
?
引言:2003 年 至 20 1 6 年 全 國 居 民 人 均 可 支 配 收 入 基 尼 系 數 均在〇 . 4 以 上;
良 好 的 收入 差 距 測 度 指標 需 具 備 匿 名 性 、 齊 次 性 、 總 體 獨 立 性 、 轉 移 性 和 強 洛 倫 茲一 致性;
?
測算:中 國 勞動 統(tǒng) 計 年 鑒;
農林牧 采礦業(yè) 制 造 業(yè) 電 熱 燃 建 筑 業(yè) 批 零 售 交 通運?住 宿 餐 信傳 輸;
行 業(yè) 平 均 工 資 泰 爾 指 數 ( t h e i l ) , 簡 稱 行 業(yè) 泰 爾 指 數 或 泰 爾 指 數,由 廣 義 熵 指 數 轉 化 而 來 ,
?
主成分分析:主 成 分分 析 是一 種分 析、 簡 化 數據 集 的 技 術 , 可 以 有 效 的 降 低 維 數 , 同 時 保持 了 數據 對 方 差
的 貢 獻 , 通過 保 留 低 階 主 成 分 , 忽 略 高 階 主 成 分 做 到 的.
其 基 本 思 想 是 : 設 法 將 原 來 具 有一 定相 關性 的 指 標 , 重 新 組 合 成一 組 新 的 相 互 無 關 的 綜 合 指 標, 并 代替 原 來 的 指 標。
1) 設 有n 個 樣 品, P 個 指 標 , 將 原 始 數據 標 準 化 , 得 到 標 準 化 矩 陣 ;
2 ) 建 立 變 量 的 相 關 系 數 陣 ;
3 )求R 的 特 征 值 和 相 應 的 單 位 特 征 向 量 ;
4 )計算 方 差 貢 獻 率 和 累 計 方 差 貢 獻 率:每 個 主 成 分 貢 獻 率 代 表 原 數據 總 信 息 量 的 百 分比 ;
5 ) 確 定 主 成 分 : 設為 p 個 主 成 分 , 其 中 前m 個 主 成 分 包 含 的 數據 信 息 總量( 即 其 累 計 方 差 貢 獻 率 ) 不 低 于8 0 % 時 , 可 以 取 前 m 個 主 成 分來 反 映 評 價 對 象 ;
6 ) 用 原 指 標 的 線 性 組 合來計算 各 成 分 得 分 :以 各 主 成 分 對原 來 指 標 的 相 關 系 數 為 權 , 將主 成 分 表 示 為 原 指 標 的 線 性 組 合 , 而 主 成 分 的 經 濟 意 義 則 由 各 線 性 組 合 中 權數 較 大 的 指 標 綜合 意 義 來 確 定;
7 ) 綜 合 得 分 :以 各 主 成 分 的 方 差 貢 獻 率 為 權 , 將其 線 性 組 合 得 到綜 合 評 價 函 數 ;
8 )得 分 排 序:利 用 總 得 分 可 以 得 到 得 分 名 次.
?
選 取 表1中 的 數據 ,200 7- 20 1 6年 十 年 期 間3 0 個 地 區(qū) 的 居 民 工 資 收 入 的 泰 爾 指 數 , 來 研
究 地 區(qū) 收 入 差 距.由 于 這 十 年 工 資 存 在一 定 相 關性, 數據 之 間 會 有 重 疊 的 信 息 , 所 以 選 取 主 成分分 析方 法 , 達 到 降 維 目 的. 用 R 軟 件 計算 相 應 的 特 征 值、 特 征 向 量 和 貢 獻 率 , 結 果 見 表3 .
從 表3中 可 以 看 出 , 前 三 個 主 成 分 的 累 積 貢 獻 率 達 到96 %, 各 指 標 的 解 釋 程 度 分 別 為4 8 %、3 7 % 和 1 0 %, 且 前 三 個 主 成 分 的 特 征 值 分 別 為4 . 88、3 . 8 和 1 . 0 1, 從 第 四 個 主 成 分 開 始 ,其特 征 值 和 方 差 貢 獻 率 的 大 小 都 在減 小 , 綜 合1 0 項 指 標 信 息 能力 較 弱, 因 此 選 取 前 三 個 主 成分 進 行 分 析 比 較 合 適。
表4中 的r c l、r c 2 和 r c 3 分 別 表 亦 第一 主 成 分、 第 二 主 成 分 和 第 二 主 成 分 對2 00 7- 20 1 6年 十 個 變 量 的 載 荷 大 小 ,h 2 欄 是 成 分 公 因 子 方 差, 是 主 成 分 對 每 個 變 量 的 方 差 解 釋 度. u 2 欄是 成 分 唯
一 性, 是 主 成 分 無 法 解 釋 變 量 方 差 的 比 例 , 其 值 為l- l i 2.
從 表4可 以 看 出 第一 主 成分 和200 8 、 20 09 、 2 0 1 0 、 20 1 1、2 0 1 2 相 性關 較 大 , 第 二 主 成 分 和 20 1 3 、 20 1 4 、 2 0 1 5、2 0 1 6 相 關性 較 大 , 第 三 主 成 分 和200 7 相 關性 較 大, 都 已 達 到9 0 % 以 上 即 為 高 度 正 相 關 .
計算 成 分 系 數矩 陣 如 表 5 所 示.
?
灰色聚類分析:灰 色 聚 類 是一 種 重要 的 灰 技 術, 研 究 對 象 是 部 分 信 息 己 知 , 部 分 信 息 未 知 的“小 樣 本”、“貧信息”不 確 定 系 統(tǒng)。灰 色 白 化 權 函 數 聚 類 屬 于 灰 色 聚 類 , 是 以 灰 數 的 白 化 函 數 為 基 礎 的 , 它將 聚 類 對 象 對 不 同 聚 類 指 標 所 擁 有 的 白 化 數 , 按 若 干 灰 類 進 行 歸 納 , 從 而 判 斷 出 聚 類 對 象 屬于 哪一 個 灰 類。
總結
以上是生活随笔為你收集整理的基 于 主 成 分分 析 和 灰 色 聚 类 对 我 国 居 民 收 入 差 距 分 析(陈 宝 平)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 海外营销人员福音:新的TikTok工具,
- 下一篇: 爬虫之邮箱混淆