几种简单的主题模型(生成模型)
生活随笔
收集整理的這篇文章主要介紹了
几种简单的主题模型(生成模型)
小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
了解主題模型,一般都會(huì)提到幾種最基礎(chǔ)的生成模型:Unigram model、Mixture of unigram,pLSA,接下來(lái)簡(jiǎn)單介紹一下他們之間的區(qū)別:
1.Unigram model
左圖可知,一篇文檔由詞生成,每個(gè)詞有其出現(xiàn)的概率,所有詞概率的乘積即得到生成文檔的概率。
2.Mixture of unigram
相比unigram多了一層主題的條件概率,在各主題下出現(xiàn)的所有詞的概率乘積之和即為生成文檔的概率。
3.pLSA
plsa與mix unigram的區(qū)別是給定了多個(gè)可能的主題,另外該模型與LDA相比,是沒(méi)有詞分布和話題分布對(duì)應(yīng)的共軛分布狄利克雷分布,即
4.textrank
可以提取文本的關(guān)鍵詞、摘要等
總結(jié)
以上是生活随笔為你收集整理的几种简单的主题模型(生成模型)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 使用Excel批量提取文件名
- 下一篇: shell bash终端中输出的颜色和格