贝叶斯算法对文本进行分类实例
生活随笔
收集整理的這篇文章主要介紹了
贝叶斯算法对文本进行分类实例
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
貝葉斯算法中最重要用的用的最廣的是
使用多項式樸素貝葉斯的地方是文本分類,其中特征與待分類文檔中的字數(shù)或頻率有關(guān)。
將使用20個新聞組語料庫中的稀疏字數(shù)功能來將這些短文檔分類。
數(shù)據(jù)集的介紹
使用 sklearn.datasets中的 fetch_20newsgroups
該數(shù)據(jù)集介紹
20 newsgroups數(shù)據(jù)集18000篇新聞文章,一共涉及到20種話題,所以稱作20 newsgroups text dataset,分文兩部分:訓(xùn)練集和測試集,通常用來做文本分類.
詳細可看
https://blog.csdn.net/imstudying/article/details/77876159
開始
from sklearn.datasets import fetch_20newsgroups data = fetch_20newsgroups() data.target_names ['alt.atheism','comp.graphics','comp.os.ms-windows.misc','comp.sys.ibm.pc.hardware','comp.sys.mac.hardware','comp.windows.x','misc.forsale','rec.autos','rec.motorcycles','rec.sport.baseball','rec.sport.hockey','sci.crypt','sci.electronics',總結(jié)
以上是生活随笔為你收集整理的贝叶斯算法对文本进行分类实例的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: win7怎么刻录iso Win7如何刻录
- 下一篇: 贝叶斯分类算法