第15课:基于 CRF 的中文命名实体识别模型实现
命名實體識別在越來越多的場景下被應用,如自動問答、知識圖譜等。非結構化的文本內容有很多豐富的信息,但找到相關的知識始終是一個具有挑戰(zhàn)性的任務,命名實體識別也不例外。
前面我們用隱馬爾可夫模型(HMM)自己嘗試訓練過一個分詞器,其實 HMM 也可以用來訓練命名實體識別器,但在本文,我們講另外一個算法——條件隨機場(CRF),來訓練一個命名實體識別器。
淺析條件隨機場(CRF)
條件隨機場(Conditional Random Fields,簡稱 CRF)是給定一組輸入序列條件下另一組輸出序列的條件概率分布模型,在自然語言處理中得到了廣泛應用。
首先,我們來看看什么是隨機場。“隨機場”的名字取的很玄乎,其實理解起來不難。隨機場是由若干個位置組成的整體,當按照某種分布給每一個位置隨機賦予一個值之后,其全體就叫做隨機場。
還是舉詞性標注的例子。假如我們有一個十個詞形成的句子需要做詞性標注。這十個詞每個詞的詞性可以在我們已知的詞性集合(名詞,動詞……)中去選擇。當我們?yōu)槊總€詞選擇完詞性后,這就形成了一個隨機場。
了解了隨機場,我們再來看看馬爾科夫隨機場。馬爾科夫隨機場是隨機場的特例,它假設隨機場中某一個位置的賦值僅僅與和它相鄰的位置的賦值有關,和與其不相鄰的位置的賦值無關。
繼續(xù)舉十個詞的句子詞性標注的例子。如果我們假設所有詞的詞性只和它相鄰的詞的詞性有關時,這個隨機場就特化成一個馬爾科夫隨機場。比如第三個詞的詞性除了與自己本身的位置有關外,還只與第二個詞和第四個詞的詞性有關。
理解了馬爾科夫隨機場,再理解 CRF 就容易了。CRF 是馬爾科夫隨機場的特例,它假設馬爾科夫隨機場中只有 X 和 Y 兩種變量?
總結
以上是生活随笔為你收集整理的第15课:基于 CRF 的中文命名实体识别模型实现的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 第16课:动手实战中文句法依存分析
- 下一篇: 第14课:动手实战中文命名实体提取