Porter Stemming Algorithm
生活随笔
收集整理的這篇文章主要介紹了
Porter Stemming Algorithm
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
????? 所謂Stemming,可以稱為詞根化,這里有個overview。在英語這樣的拉丁語系里面,單詞有多種變形。比如加上-ed、-ing、-ly等等。在分詞的時候,如果能夠把這些變形單詞的詞根找出了,對搜索結果是很有幫助的。Stemming算法有很多了,三大主流算法是Porter stemming algorithm、Lovins stemming algorithm、Lancaster (Paice/Husk) stemming algorithm,還有一些改進的或其它的算法。
轉載于:https://www.cnblogs.com/codingmylife/archive/2012/11/06/2756686.html
總結
以上是生活随笔為你收集整理的Porter Stemming Algorithm的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Oracle 分类统计sql
- 下一篇: msgrcv函数