TfidfVectorizer(stop_words='english',ngram_range=(1,1))中ngram_range的意义
生活随笔
收集整理的這篇文章主要介紹了
TfidfVectorizer(stop_words='english',ngram_range=(1,1))中ngram_range的意义
小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
tfidf = TfidfVectorizer(stop_words='english',ngram_range=(1,1))
中ngram_range(min,max)是指將text分成min,min+1,min+2,…max 個(gè)不同的詞組
比如’Python is useful’中ngram_range(1,3)之后可得到’Python’ ‘is’ ‘useful’ ‘Python is’ ‘is useful’ 和’Python is useful’如果是ngram_range (1,1) 則只能得到單個(gè)單詞’Python’ ‘is’和’useful’
原文鏈接:https://www.jianshu.com/p/c39feaf0d62f
總結(jié)
以上是生活随笔為你收集整理的TfidfVectorizer(stop_words='english',ngram_range=(1,1))中ngram_range的意义的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: sapCy简介
- 下一篇: memset()函数介绍