PCNN的知识抽取
PCNN是一個(gè)結(jié)構(gòu)簡(jiǎn)單的CNN網(wǎng)絡(luò), 它最初被用于在已知實(shí)體對(duì)位置時(shí), 辨別實(shí)體對(duì)關(guān)系的網(wǎng)絡(luò).
上圖是論文里帶的PCNN結(jié)構(gòu)圖.
PCNN的輸入由兩部分構(gòu)成, 一部分是詞本身的詞向量word, 另一部分是詞相對(duì)于實(shí)體詞的位置信息position. PCNN優(yōu)秀的地方就在于加入了位置信息, 具體如下:
1.position共有兩個(gè), 分別對(duì)應(yīng)兩個(gè)實(shí)體位置. 以"小明的外號(hào)叫老王"為例, 分詞時(shí)會(huì)被分成"小明 的 外號(hào) 叫 老王"5個(gè)詞, 其中兩個(gè)實(shí)體分別為"小明"和"老王"., 那么其他詞相對(duì)于"小明"的位置信息是0,1,2,3,40 ,1 ,2 ,3 ,40,1,2,3,4 相對(duì)于"老王"的位置信息是4,3,2,1,04,3,2,1,04,3,2,1,0這兩列位置信息就會(huì)與對(duì)應(yīng)的詞向量拼接在一起, 形成上圖中左側(cè)的輸入.
假設(shè)此時(shí)詞向量維度n=4, 加上兩維位置就是6.
輸入問(wèn)題解決后, 此時(shí)輸入尺寸為65(5個(gè)詞). 下一步, 輸入經(jīng)過(guò)一個(gè)633(3通道), 步長(zhǎng)向下為1且保留列長(zhǎng)度(列長(zhǎng)9)的卷積, 獲得了19*3的卷積結(jié)果, 這樣做是希望網(wǎng)絡(luò)能如我們所愿, 從三個(gè)視角(即兩實(shí)體將句子分成三份)觀測(cè)潛在關(guān)系.
下一步是池化. PCNN的池化是將3通道19的數(shù)據(jù)濃縮為3通道13后, 再拼成19. 注意它池化的方式, 它并不是以一個(gè)固定的池化方式做池化, 而是以實(shí)體所在位置為分界, 池化3次, 這就注定池化后的尺寸必為3通道13, 也就是說(shuō)你大可不必規(guī)定具體的輸入句子長(zhǎng)度.
最后一層分類(lèi), 沒(méi)什么可解釋的, 是通用做法.
總結(jié)
- 上一篇: ISO27145协议解析
- 下一篇: 网易VIP邮箱及163vip邮箱特点介绍