bert pytorch 序列标注_序列标注:Bi-LSTM + CRF
最近在做序列標(biāo)注的相關(guān)任務(wù),為了理解bi-lstm + crf的原理及細(xì)節(jié),找了很多相關(guān)資料,以及代碼實(shí)現(xiàn),這里分享給大家并附上一些自己的理解。
CRF
相關(guān)資料推薦
關(guān)于crf,我看了很多資料,這里推薦幾個(gè) - 英文的crf tutorial - 李航的統(tǒng)計(jì)學(xué)習(xí)方法 這兩個(gè)講的很細(xì),公式很多,很多新入坑的小白看了肯定一頭霧水,這里推薦一個(gè)知乎大神的回答,通俗易懂,有一些機(jī)器學(xué)習(xí)基礎(chǔ)的都可以看懂。 - 知乎Scofield的回答
簡(jiǎn)單總結(jié)
這里我簡(jiǎn)單總結(jié)一下,以命名實(shí)體識(shí)別任務(wù)舉例,我們有這樣一組已標(biāo)注的數(shù)據(jù),B表示一個(gè)實(shí)體的開(kāi)頭,I表示當(dāng)前詞為命名實(shí)體的后面部分,O表示不是命名實(shí)體。
the(B) wall(I) street(I) journal(I) reported(O) today(O) that(O) apple(B) corporation(I) made(O) money(O)
很明顯"the wall street journal"(華爾街日?qǐng)?bào))、"apple corporation"(蘋(píng)果公司)為命名實(shí)體。
如果我們有這樣一組已標(biāo)注的數(shù)據(jù)
每個(gè) x_i 是輸入序列,y_i為一個(gè)標(biāo)注序列
我們的目標(biāo)是學(xué)習(xí)出一組條件概率分布模型, 即找到一組參數(shù) theta
使得
總結(jié)
以上是生活随笔為你收集整理的bert pytorch 序列标注_序列标注:Bi-LSTM + CRF的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 信用卡账单分期还款需要注意哪些事项
- 下一篇: 买债券一万能赚多少?终于算清楚了!