第08课:从自然语言处理角度看 HMM 和 CRF
生活随笔
收集整理的這篇文章主要介紹了
第08课:从自然语言处理角度看 HMM 和 CRF
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
近幾年在自然語言處理領域中,HMM(隱馬爾可夫模型)和 CRF(條件隨機場)算法常常被用于分詞、句法分析、命名實體識別、詞性標注等。由于兩者之間有很大的共同點,所以在很多應用上往往是重疊的,但在命名實體、句法分析等領域 CRF 似乎更勝一籌。通常來說如果做自然語言處理,這兩個模型應該都要了解,下面我們來看看本文的內容。
從貝葉斯定義理解生成式模型和判別式模型
理解 HMM(隱馬爾可夫模型)和 CRF(條件隨機場)模型之前,我們先來看兩個概念:生成式模型和判別式模型。
在機器學習中,生成式模型和判別式模型都用于有監督學習,有監督學習的任務就是從數據中學習一個模型(也叫分類器),應用這一模型,對給定的輸入 X 預測相應的輸出 Y。這個模型的一般形式為:決策函數 Y=f(X) 或者條件概率分布 P(Y|X)。
首先,簡單從貝葉斯定理說起,若記 P(A)、P(B) 分別表示事件 A 和事件 B 發生的概率,則 P(A|B) 表示事件 B 發生的情況下事件 A 發生的概率;P(AB)表示事件 A 和事件 B 同時發生的概率。
根據貝葉斯公式可以得出:
生成式模型:估計的是聯合概率分布,P(Y, X)=P(Y|X)*P(X),由聯合概率密度分布 P(X,Y),然后求出條件概率分布 P(Y|X) 作為預測的模型,即生成模型公式為:P(Y|X
總結
以上是生活随笔為你收集整理的第08课:从自然语言处理角度看 HMM 和 CRF的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 第10课:动手实战基于 CNN 的电影推
- 下一篇: 第07课:动手实战基于 ML 的中文短文