python模糊匹配_python 字符串模糊匹配 Fuzzywuzzy
Python提供fuzzywuzzy模塊,不僅可用于計算兩個字符串之間的相似度,而且還提供排序接口能從大量候選集中找到最相似的句子。
(1)安裝
pip install fuzzywuzzy
(2)接口說明
兩個模塊:fuzz, process,fuzz主要用于兩字符串之間匹配,process主要用于搜索排序。
fuzz.ratio(s1,s2)直接計算s2和s2之間的相似度,返回值為0-100,100表示完全相同;
fuzz.partial_ratio(S1,S2)部分匹配,如果S1是S2的子串依然返回100;
fuzz.token_sort_ratio(S1,S2)只比較S1,S2單詞是否相同,不考慮詞語之間的順序;
fuzz.token_set_ratio(S1,S2)相比fuzz.token_sort_ratio不考慮詞語出現的次數;
process.extract(S1, ListS,limit=n),表示從列表ListS中找出Top n與S1最相似的句子;
process.extractOne(S1,ListS),返回最相似的一個
1
2
3
4
5
6
7
8
9
10
11
(3)使用
from fuzzywuzzy import fuzz
a = 'a b c'
b = ' a c b '
c = 'a c'
fuzz.ratio(a, c)
>> 75
fuzz.ratio(b, c)
>> 60
fuzz.partial_ratio(a, c)
>> 67
fuzz.partial_ratio(b, c)
>> 100
fuzz.token_sort_ratio(a, c)
>> 75
fuzz.token_sort_ratio(b, c)
>> 75
fuzz.token_set_ratio(a, c)
>> 100
fuzz.token_set_ratio(b, c)
>> 100
---------------------
簡單易用的字符串模糊匹配庫Fuzzywuzzy
簡單易用的字符串模糊匹配庫Fuzzywuzzy 閱讀目錄 FuzzyWuzzy 簡介 安裝 用法 已知移植 FuzzyWuzzy 簡介 FuzzyWuzzy 是一個簡單易用的模糊字符串匹配工具包.它依 ...
C++實現的字符串模糊匹配
C++基本沒有正則表達式功能,當然像Boost里提供了正則.本文來源于博客園園友的一篇文章,請看: C/C++ 字符串模糊匹配 很早之前就看過這篇文章,原作者的需求很明確.代碼實現也很好. 之所以又寫 ...
流動python - 字符串KMP匹配
首先我們看一下簡單的字符串匹配. 你可以把文本字符串s固定,模式字符串p從s對齊的左邊緣,作為承擔部分完全一致,匹配成功,失敗將是模式字符串p整體向右1地點,繼續檢查對齊部分,重復. #樸素匹配 de ...
mybatis字符串模糊匹配
1.? 參數中直接加入%%,注意不需要加兩個單引號,加了就會出錯,因為系統會自動為字符串類型加上兩個單引號
.NET ->;>; 分享一個字符串模糊匹配指數的方法
鏈接: http://www.tsjensen.com/blog/post/2011/05/27/Four+Functions+For+Finding+Fuzzy+String+Matches+In+ ...
python模糊匹配之fuzzywuzzy
fuzzywyzzy 是python下一個模糊匹配的模塊.首先要安裝fuzzywuzzy 示例: from fuzzywuzzy import fuzz from fuzzywuzzy import ...
python中RabbitMQ的使用(路由鍵模糊匹配)
路由鍵模糊匹配 使用正則表達式進行匹配.其中“#”表示所有.全部的意思:“*”只匹配到一個詞. 匹配規則: 路由鍵:routings = [ 'happy.work', ?'happy.life' , ...
HDU 2585 Hotel(字符串的模糊匹配+遞歸)
Problem Description Last year summer Max traveled to California for his vacation. He had a great tim ...
mysql 兩張表字段模糊匹配--字符串拼接函數
concat(A,B,C,...) ?拼接字符串 例如concat('123','***','345') ?=>123***345 SELECT concat( substr(t1.CODE, ...
隨機推薦
eclipse maven spring mvc el表達式無效
http://www.myexception.cn/javascript/2031310.html
Oracle-記錄學習
--select name,count(id) from work_test group by name having count(id)>1--select upper(name),t.*,l ...
Java與WCF交互(一)補充:用WSImport生成WSDL的Java客戶端代碼
在一 文中,我描述了用axis2的一個Eclipse控件生成WCF的Java客戶端代理類,后來有朋友建議用Xfire.CXF,一 ...
LINUX搭建SVN客戶端和多個項目的權限分組管理
搭建SVN服務,有效的管理代碼,以下三步可以快速搞定.1.安裝 #yum install subversion 判斷是否安裝成功 1 #subversion -v svnserve, version ...
將String轉換為其表示的路徑畫到屏幕上
關于這個問題,我已經在另一篇blog中有所提及: CoreText精彩文字輪廓繪制動畫的一點改進 不過原有的轉換代碼使用Obj-C寫的,在這里我們嘗試將其轉換為Swift語言,然后利用它實現一個測試小 ...
基于.NetCore的Redis5.0.3(最新版)快速入門、源碼解析、集群搭建與SDK使用【原創】
1.[基礎]redis能帶給我們什么福利 Redis(Remote Dictionary Server)官網:https://redis.io/ Redis命令:https://redis.io/co ...
AndrewNG Deep learning課程筆記 - CNN
參考, An Intuitive Explanation of Convolutional Neural Networks http://www.hackcv.com/index.php/archiv ...
微信公眾號UX分析—— 學生作業小結
1. 不足: 1. 權威性:個人帳號,顯得不夠正式. 2. 排版問題: + 沒有必要的外接端口,界面設計極度缺少排版.哪怕是個人公眾號都不至于如此,更何況這是一個學校的教務平臺. 3. 反應不及時或無 ...
win10 Java環境變量,hadoop 環境變量
媽呀,今天又重裝了系統.需要裝上java環境. 安裝環境老百度,然后老掉坑.(path 路經) 1,新建環境變量 JAVA_HOME 2, 新建 CLASSPATH 環境變量 .;%JAVA_HOME ...
總結
以上是生活随笔為你收集整理的python模糊匹配_python 字符串模糊匹配 Fuzzywuzzy的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: android 三星截长屏,三星如何截屏
- 下一篇: 手摸手深入理解JVM虚拟机--在MacO