ucinet网络分析使用总结
ucinet介紹
UCINET為菜單驅(qū)動(dòng)的Windows程序,可能是最知名和最經(jīng)常被使用的處理社會網(wǎng)絡(luò)數(shù)據(jù)和其他相似性數(shù)據(jù)的綜合性分析程序。與UCINET捆綁在一起的還有Pajek、Mage和NetDraw等三個(gè)軟件。UCINET能夠處理的原始數(shù)據(jù)為矩陣格式,提供了大量數(shù)據(jù)管理和轉(zhuǎn)化工具。該程序本身不包含 網(wǎng)絡(luò)可視化的圖形程序,但可將數(shù)據(jù)和處理結(jié)果輸出至NetDraw、Pajek、Mage和KrackPlot等軟件作圖。UCINET包含大量包括探測凝聚子群(cliques, clans, plexes)和區(qū)域(components, cores)、中心性分析(centrality)、個(gè)人網(wǎng)絡(luò)分析和結(jié)構(gòu)洞分析在內(nèi)的網(wǎng)絡(luò)分析程序。UCINET還包含為數(shù)眾多的基于過程的分析程序,如聚類分析、多維標(biāo)度、二模標(biāo)度(奇異值分解、因子分析和對應(yīng)分析)、角色和地位分析(結(jié)構(gòu)、角色和正則對等性)和擬合中心-邊緣模型。此外,UCINET提供了從簡單統(tǒng)計(jì)到擬合p1模型在內(nèi)的多種統(tǒng)計(jì)程序。
ucinet使用技巧
ucinet的安裝我覺得不用多說,因?yàn)椴徽撌莄sdn本站,還是百度里面都有很多的資源可以下載,一般都是英文版,所以我就不從開頭介紹了。另外就是雖然很多東西當(dāng)初用過并且記得,但等過了一段時(shí)間后,再次看這個(gè)功能其實(shí)很可能英文單詞的意思都已經(jīng)忘了,就記得如何去使用。所以這里,我直接以一個(gè)案例的方式進(jìn)行演示:
1.數(shù)據(jù)導(dǎo)入:
Ucinet的數(shù)據(jù)輸入方式有多種:初始數(shù)據(jù)(Raw)、Excel數(shù)據(jù)和數(shù)據(jù)語言數(shù)據(jù)(Data Language,DL)。Ucinet處理的Excel數(shù)據(jù)最多只能有255列。就好像我記得excel的最大存儲數(shù)據(jù)為104萬左右,超過就會提示顯示不全。ucinet它導(dǎo)入數(shù)據(jù)步驟為輸入路徑:數(shù)據(jù)>輸入> Excel矩陣:
當(dāng)然,這里只是為了測試是否這個(gè)數(shù)據(jù)可以被ucinet所引用,不會有什么亂碼或者其它格式問題,另外如果中途選擇了什么其它操作,那么除了上述的打印外,還將生成了一個(gè)新的excel文件位于上面的路徑。
2.可視化數(shù)據(jù)分析
網(wǎng)絡(luò)密度指的是網(wǎng)絡(luò)中各個(gè)成員之間聯(lián)系的緊密度,可以通過網(wǎng)絡(luò)中實(shí)際存在的關(guān)系數(shù)與理論上可能存在的關(guān)系數(shù)相比得到,成員之間的聯(lián)系越多,該網(wǎng)絡(luò)的密度越大。整體網(wǎng)的密度越大,該網(wǎng)絡(luò)對其中行動(dòng)者的態(tài)度、行為等產(chǎn)生的影響可能越大。計(jì)算的時(shí)候最好將多值關(guān)系數(shù)據(jù)轉(zhuǎn)換成二值關(guān)系數(shù)據(jù)。將多值關(guān)系數(shù)據(jù)轉(zhuǎn)換成二值關(guān)系數(shù)據(jù)路徑:變換→對分。
在對原始數(shù)據(jù)進(jìn)行二值化處理以后,所有的權(quán)值變?yōu)榱?和1(即是否有關(guān)聯(lián)),這樣計(jì)算出來的結(jié)果是普通的中心度。想要得到加權(quán)網(wǎng)絡(luò)的中心性,只需要在矩陣數(shù)據(jù)中保留權(quán)值,不進(jìn)行二值化計(jì)算即可,和之前的唯一區(qū)別在于計(jì)算公式中的0與1變成了具體的權(quán)值。
我們這里也可以進(jìn)行二值化,將上述的頻次轉(zhuǎn)換成只有0、1變量的數(shù)據(jù),我這里不轉(zhuǎn)了,依據(jù)的公式一般是:
Hij={1,ifxi∈Nk(xj)orxj∈Nk(xi)0,otherwise}H_{ij}=\left\{ \begin{matrix} \text{1,}& \,\,\text{if\,\,}x_i\in N_k\left( x_j \right) \quad \,\,\text{or\,\,}x_j\in N_k\left( x_i \right)\\ \text{0,}& \,\,\text{otherwise\,\,}\\ \end{matrix} \right\} Hij?={1,0,?ifxi?∈Nk?(xj?)orxj?∈Nk?(xi?)otherwise?}
其中Nk(xi)N_k\left( x_i \right)Nk?(xi?)表示數(shù)據(jù)集中距離xix_{i}xi?最近的 k 個(gè)鄰居的集合。
然后我們需要將excel文件轉(zhuǎn)換成ucinet能識別的類型,即.h結(jié)尾的文件,這里有很多種轉(zhuǎn)換的方式,我比較喜歡的是打開一個(gè)矩陣,然后將數(shù)據(jù)導(dǎo)入,這里它會提示imported success,然后將其以.h文件保存到桌面,然后就可以開始可視化了。
最后進(jìn)入netdraw直接可視化,選項(xiàng)為Net- Draw >Open > Ucinet Dataset > Network:
這里我們可以在右邊欄看到可選框,可以根據(jù)喜好改變點(diǎn)的大小顏色以及線的粗細(xì),另外就是去除某個(gè)點(diǎn)對整體圖的影響,檢測整個(gè)系統(tǒng)的波動(dòng)性和穩(wěn)定性,這個(gè)我記得我之前都是做層次分析法或者PCA用的,但在網(wǎng)絡(luò)里自己也沒試過這個(gè)。
我主要試的是圖上面的工具欄,可以選擇中心性的網(wǎng)絡(luò)可視化,即centrality measures:
選擇任何一個(gè)圖都會根據(jù)其改變,比如我選擇closeness:
然后關(guān)于上述的區(qū)別,也就是我接下來要總結(jié)的,但只是做一個(gè)粗略總結(jié)。
3、社會網(wǎng)絡(luò)分析技術(shù)
首先如果數(shù)據(jù)不是非結(jié)構(gòu)化數(shù)據(jù),并且它的缺失值與異常值都在合理范圍內(nèi)(關(guān)于上述兩者的概念,我在另一篇博客有提:kaggle(一):隨機(jī)森林與泰坦尼克),那么我們可以做一個(gè)相關(guān)性分析,相關(guān)系數(shù)公式即為:
pij=E(yiyj)?E(yi)E(yj)([E(yi2)?(E(yi))2]?[E(yj2)?(E(yj))2]p_{ij}=\frac{E\left( y_iy_j \right) -E\left( y_i \right) E\left( y_j \right)}{\sqrt{\left( \left[ E\left( y_{i}^{2} \right) -\left( E\left( y_i \right) \right) ^2 \right] \cdot \left[ E\left( y_{j}^{2} \right) -\left( E\left( y_j \right) \right) ^2 \right] \right.}} pij?=([E(yi2?)?(E(yi?))2]?[E(yj2?)?(E(yj?))2]?E(yi?yj?)?E(yi?)E(yj?)?
可以根據(jù)它得到相關(guān)系數(shù)權(quán)值矩陣,以此去判斷一些指標(biāo)權(quán)重密度還有啥的,不過ucinet基本都封裝好了,我在這里提一下,因?yàn)槲蚁旅娴臄?shù)據(jù)基本都是圍繞這個(gè)來弄,
社會網(wǎng)絡(luò)分析技術(shù)主要有網(wǎng)絡(luò)密度、中心性分析、凝聚子群分析、核心-邊緣分析等,這里對涉及到的前三種方法作簡單介紹。
中心性(centrality)是度量整個(gè)網(wǎng)絡(luò)中心化程度的重要指標(biāo),在城市群網(wǎng)絡(luò)中,處于中心位置的城市更易獲得資源和信息,擁有更大的權(quán)力和對其他城市更強(qiáng)的影響力。網(wǎng)絡(luò)中心性又可以分為點(diǎn)度中心度、接近中心度和中間中心度三個(gè)指標(biāo)。
| 絕對點(diǎn)度中心度 | CADi=d(i)=∑jXijC_{ADi}=d\left( i \right) =\sum_j{X}_{ij}CADi?=d(i)=j∑?Xij? | CABi=∑j<kbjk(i)=∑j<kgjk(i)/gjkC_{A B i}=\sum_{j<k} b_{j k}(i)=\sum_{j<k} g_{j k}(i) / g_{j k}CABi?=j<k∑?bjk?(i)=j<k∑?gjk?(i)/gjk? | CAPi?1=∑jdijC_{A P i}^{-1}=\sum_{j} d_{i j}CAPi?1?=j∑?dij? |
| 相對點(diǎn)度中心度 | CRDi=d(i)/(n?1)C_{RDi}^{}=d\left( i \right) /\left( n-1 \right)CRDi?=d(i)/(n?1) | CRBi=2CABi/[(n?1)(n?2)]C_{RBi}^{}=2C_{ABi}^{}/\left[ \left( n-1 \right) \left( n-2 \right) \right]CRBi?=2CABi?/[(n?1)(n?2)] | CRPi?1=2CAPi?1/(n?1)C_{RPi}^{-1}=2C_{APi}^{-1}/\left( n-1 \right)CRPi?1?=2CAPi?1?/(n?1) |
| 圖的中心勢 | CAD=∑i(CADmax??CADi)(n?1)(n?2)CRD=∑i(CRDmax??CRDi)n?2\begin{array}{l}{C_{A D}=\frac{\sum_{i}\left(C_{A D \max }-C_{A D i}\right)}{(n-1)(n-2)}} \\ {C_{R D}=\frac{\sum_{i}\left(C_{R D \max }-C_{R D i}\right)}{n-2}}\end{array}CAD?=(n?1)(n?2)∑i?(CADmax??CADi?)?CRD?=n?2∑i?(CRDmax??CRDi?)?? | CB=2∑i(CABmax??CABi)/[(n?1)2(n?2)]=2∑i(CBBmax??CRBi)/(n?1)C_B=2\sum_i{\left( C_{AB\max}-C_{ABi} \right)}/\left[ \left( n-1 \right) ^2\left( n-2 \right) \right] =2\sum_i{\left( C_{BB\max}-C_{RBi} \right)}/\left( n-1 \right)CB?=2i∑?(CABmax??CABi?)/[(n?1)2(n?2)]=2i∑?(CBBmax??CRBi?)/(n?1) | CC=∑i(CRCmax?′?CRCi′)(n?2)(n?1)(2n?3)C_{C}=\frac{\sum_{i}\left(C_{R C \max }^{\prime}-C_{R C i}^{\prime}\right)}{(n-2)(n-1)}(2 n-3)CC?=(n?2)(n?1)∑i?(CRCmax′??CRCi′?)?(2n?3) |
上表摘自SNA(社會網(wǎng)絡(luò)分析)——三種中心度總結(jié),這張表里的有些公式和我之前建模用過的差不多,不外乎就是中間有進(jìn)行過變式,就比如我之前喜歡寫n3?4n2+5n?2=(n?1)2(n?2)n^{3} - 4n^{2} + 5n -2 = \left( n-1 \right) ^2\left( n-2 \right)n3?4n2+5n?2=(n?1)2(n?2),然后中間具體怎么推導(dǎo)的,例如betweenness可以看我給的參考鏈接2,我不是專門研究的我也不太清楚。我們還可以來看一下相關(guān)的圖,對于上述三種情況的文字對比圖:
然后我們就可以用ucinet軟件做出上述三種關(guān)系,這里只做一個(gè),因?yàn)椴襟E操作都是基本一致的,選擇network ——> centrality ——> Degree ,就可以得到Degree centrality :
closeness centrality:
然后關(guān)于betweenness centrality,一般都是選擇Node betweenness ,其它兩種lines和Hierarchically Reduction 我也沒有在實(shí)際建模中用過,不太清楚有啥具體意義,而且這兩種沒有顯示完各個(gè)點(diǎn)中心性值后的探索性分析的表格,關(guān)于一些平均值、方差、標(biāo)準(zhǔn)差等,所以這里直接拉到第一個(gè)就行了。
關(guān)于上述三張表所能給出的信息,我們都可以通過分析他們按高位降序排序的指標(biāo)來進(jìn)一步得出結(jié)果,其中還是以Degree centrality為例,因?yàn)槲覜]有進(jìn)行二值化,或者說排除一些其它類型的指標(biāo),另外就是當(dāng)時(shí)晚上時(shí)間匆忙,現(xiàn)在第二天是接著昨晚的寫,一般如果數(shù)據(jù)做了處理,當(dāng)我們做了這個(gè)中心性后,Num值的區(qū)間都是在0 ~ 100之間,排在最前的Num一定是在95%左右再降序,這樣才能根據(jù)降序來定義最后的指標(biāo)區(qū)別,這里倒是有些無法判斷。其余兩個(gè)中心性的解釋根據(jù)公式和網(wǎng)絡(luò)分析圖結(jié)合起來說明更加有真實(shí)性與連貫性,在建模中,這就是基本的網(wǎng)絡(luò)分析了。
4、凝聚子群分析
凝聚子群是滿足如下條件的-一個(gè)行動(dòng)者子集合,即在此集合中的行動(dòng)者之間具有相對較強(qiáng)、直接、緊密、經(jīng)常的或者積極的關(guān)系。城市網(wǎng)絡(luò)凝聚子群是用于揭示和刻畫城市群體內(nèi)部子結(jié)構(gòu)狀態(tài)。找到城市網(wǎng)絡(luò)中凝聚子群的個(gè)數(shù)以及每個(gè)凝聚子群包含哪些城市成員,分析凝聚子群間關(guān)系及聯(lián)接方式,這都可以從新的維度考察城市群網(wǎng)絡(luò)的發(fā)展?fàn)顩r。
利用ucinet軟件中的CONCOR法進(jìn)行凝聚子群分析。CONCOR是-種迭代相關(guān)收斂法( convergent correlation或者convergence of iterated correlation)。它基于如下事實(shí):如果對-一個(gè)矩陣中的各個(gè)行(或者列)之間的相關(guān)系數(shù)進(jìn)行重復(fù)計(jì)算(當(dāng)該矩陣包含此前計(jì)算的相關(guān)系數(shù)的時(shí)候),最終產(chǎn)生的將是一個(gè)僅由1和-1組成的相關(guān)系數(shù)矩陣。進(jìn)一步說我們可以據(jù)此把將要計(jì)算的一些項(xiàng)目分為兩類:相關(guān)系數(shù)分別為1和-1的兩類(劉軍,2009)[4]。
這個(gè)我不太記得具體有啥作用了,找自己之前寫過的網(wǎng)絡(luò)分析法中很少用凝聚子群,但確實(shí)用過所以我現(xiàn)在才有一個(gè)大致的印象,然而怎么解釋已經(jīng)忘了,都過了一年多了,所以尷尬了,還是在這里記錄一下吧,下次記起來回來補(bǔ)。
凝聚子群分析結(jié)果:
凝聚子群分析結(jié)果:
總結(jié)
其實(shí)拋開一些太專業(yè)性的東西不講,本篇博文寫得挺爽的,很久沒有敲過這么多文字以及再次以一種建模的心理完成對ucinet的一些基本操作介紹,起因是一個(gè)建模群的網(wǎng)友問我網(wǎng)絡(luò)分析里的一些技巧,還有他用python做的話好不好做,于是我去搜了一下,找到了本篇的第一篇參考文獻(xiàn),看了下python確實(shí)可以做但比較麻煩,我沒用過,而ucinet的話,腦子一閃,發(fā)現(xiàn)這不就是我大學(xué)一直在用的東西嘛,伴隨著的還有spss statistics、spss modeler、MATLAB、PS、灰色系統(tǒng)軟件、yaahp等等各種零零碎碎的東西,突然就有些懷舊,雖然剛出來不久,由大學(xué)學(xué)的電氣跨進(jìn)計(jì)算機(jī)的道路,終是專業(yè)化了,但想想曾經(jīng)大二一年里在建模路上的摸爬滾打,每次和隊(duì)友完成一篇篇論文到獲獎(jiǎng)的喜悅,也終是我如今很難獲取到的了。所以,且行且珍惜吧,end。
參考與推薦:
[1]. 六個(gè)主要的社會網(wǎng)絡(luò)分析軟件的比較
[2]. 網(wǎng)絡(luò)的介數(shù)中心性(betweenness)及計(jì)算方法
[3]. SNA(社會網(wǎng)絡(luò)分析)——三種中心度總結(jié)
[4]. 《社會網(wǎng)絡(luò)分析法》(劉軍 譯)
[5]. 薛萍. 基于社會網(wǎng)絡(luò)的研究型高校優(yōu)勢學(xué)科方向發(fā)展預(yù)測研究 [D]. 導(dǎo)師: 朱凌. 浙江大學(xué),2014
[6]. 社會網(wǎng)絡(luò)分析方法簡介
總結(jié)
以上是生活随笔為你收集整理的ucinet网络分析使用总结的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: git 配置免密登陆
- 下一篇: OpenStack Juno系列之计算节