python关系图谱_文本分析之制作网络关系图
最近忙于學術,公眾號更新的有點慢了,在這里給大家個歉,希望大家能繼續支持我。由于學術需要,未來一段時間,我以后會有一些文本分析的腳本要出現,希望大家喜歡。
目前簡單的文本分析已經滿足我人物需要,所以還不會去學機器學習,任務導向是最好的學習方法。希望大家也能找點有意思任務,python下。
今天給大家帶來我寫好的腳本,用來分析社會網絡關系。
這個圖我沒有用到gephi或者其他的工具,是我用python純腳本運行出來的。簡單的實現了封裝,大家有興趣可以下載下腳本,運行下。
原理知識
我就簡單說下原理吧,先刻畫一個簡單的圖A
import networkx as nx
import matplotlib.pyplot as plt
#有向圖
DG = nx.DiGraph()
#添加一個節點
DG.add_node('A')
#作圖,設置節點名顯示,節點大小,節點顏色
nx.draw(DG,with_labels=True,node_size=900,node_color = 'green')
plt.show()
雙節點,有方向A-->B
#有向圖
DG = nx.DiGraph()
#添加一個節點
DG.add_node('A')
DG.add_node('B')
#添加邊,有方向,A-->B
DG.add_edge('A','B')
#作圖,設置節點名顯示,節點大小,節點顏色
nx.draw(DG,with_labels=True,node_size=900,node_color = 'green')
plt.show()
添加更多節點
import networkx as nx
import matplotlib.pyplot as plt
colors = ['red', 'green', 'blue', 'yellow']
#有向圖
DG = nx.DiGraph()
#一次性添加多節點,輸入的格式為列表
DG.add_nodes_from(['A', 'B', 'C', 'D'])
#添加邊,數據格式為列表
DG.add_edges_from([('A', 'B'), ('A', 'C'), ('A', 'D'), ('D','A')])
#作圖,設置節點名顯示,節點大小,節點顏色
nx.draw(DG,with_labels=True, node_size=900, node_color = colors)
plt.show()
好了,同樣的道理,咱們建立角色詞典,插入節點列表,然后遍歷插入有向邊關系,就能做出這圖
詳情大家可以去看看實驗樓網
《Python基于共現提取《釜山行》人物關系》
這篇文章寫的很好(希望不要黑我,我也是覺得真心好)。我基本上借鑒了這篇文章思路寫今天這個腳本,實現了自動生成關系網絡圖。
準備工作
一、安裝matplotlib、networkx
二、解決matplotlib無法寫中文問題
1、找到pythonX\lib\site-packages\matplotlib\mpl-data\fonts\ttf文件夾
2、matplotlib默認調用的為DejaVuSans.ttf字體文件,網上下載個
微軟雅黑.ttf
3、將微軟雅黑文件名改為DejaVuSans.ttf粘貼到ttf文件夾下即可。
腳本文件簡介
你下載后腳本文件夾名為:人民的名義
其中的relationship.py就是大鄧寫的庫(直接能調用的哦)
實現功能:
1、讀入小數數據和角色詞典后,對數據分詞后生成角色關系數據(有向關系數據)
2、無需gephi繪圖即可制作絢麗角色關系網絡圖。
注意:
1、運行腳本前,文件夾中只保留角色名單.txt 人民的名義.txt 和 relationship.py
2、要想圖片好看點,一定要聯網啊。里面我寫了個爬蟲,爬取一個配色網站的配色值。
如果你們想單機也可以畫出好看的圖,可以修改下代碼,將代碼爬蟲部分改成讀取本地顏色數據
使用示例
1、建好小說數據中的角色字典,格式如下
2、在文件夾中放入小說txt文件(人民的名義.txt)
3、在腳本文件夾中新建一個test.py文件
#導入relationship庫中的Relationship類
from relationship import Relationship
#自定義節點詞典(小說中人物角色)
dictpath = r'/Users/suosuo/Desktop/人民的名義/角色名單.txt'
#小說路徑,只能是編碼方式為utf-8的txt文件
datapath = r'/Users/suosuo/Desktop/人民的名義/人民的名義.txt'
#程序運行生成的角色關系圖保存地址
pic = r'/Users/suosuo/Desktop/人民的名義/人物關系圖.png'
Re = Relationship(dictpath, datapath)
relation = Re.relationship()
graph = Re.network_digraph(relation, pic)
4、運行
文件夾中生成了 人物關系圖.png、node_edge.txt和node_freq.txt文件。
node_edge.txt 有向圖關系數據,可以后續導入gephi軟件自定義制圖
node_freq.txt 節點出現頻率
注意:每次運行前請把人物關系圖.png、node_edge.txt和node_freq.txt文件刪除掉,再運行
關注公眾號:大鄧帶你玩python
文中末尾附有腳本文件下載地址
更多內容
文本分析
爬蟲
神奇的python
總結
以上是生活随笔為你收集整理的python关系图谱_文本分析之制作网络关系图的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python numpy安装教程_手把手
- 下一篇: 转载:如何运用VI编辑器进行查找替换