正则体系2
零寬度斷言
?
?
56后面必須跟上9
?
?
前面不能是4
?
?
?
零寬度斷言 不匹配內容 只匹配中間的內容
?
也不計算在分組里面
?
?
?
把前面和后面變成零寬度斷言 ?主要中間的部分
?
?
?
?
?
?
?
反向在前面
正向在后面
?
?
?
?
?
模式修正符
?
?
?
?
修正正則表達式 sigmex
?
?
?
前面搭配后面的字母
搭配i忽略大小寫
?
?
?
?
?
?
?
?
?
A 忽略大小寫 b 只能是小寫
?
?
?
?
?
邊界匹配器
?
?
?
?
?
讓正則匹配更加精準
?
?
?
行首
行尾
和單詞首
單詞尾
?
?
?
一般是空格
?
?
?
?
Same 結尾
?
?
?
?
總結和實例講解
?
?
?
Js 里面的用法 ?斜線開頭
?
?
?
s出現可以 不出現也可以
?
?
?
?
和兩邊的斜杠是沖突的
?
問號和其他字符組合放在括號的開頭的時候要注意其特殊的用法
?
?
?
?
?
這里\W 本來就是特殊含義 不需要轉義成其真正含義
?
?
Url 帶參數
網上的正則不一定是想要的
?
?
?
?
正則匹配:
分類 進行匹配
?
?
?
三個都寫到或者里面其會匹配最大的
?
aa='資中縣雙河街道辦事處'
comp=re.compile(r'(街道辦事處|街道|處)')
res=comp.findall(aa)
?
把最長的寫在最前面
?
數字中間不能用橫杠
?
?
正則只適合于匹配 有規則的 且中間無其他干擾的情況的識別
?
四川自治區內江市資中縣雙河街道辦事處安木店村7單元12號
?
地址這種東西感覺不能用正則匹配出來 ??不管是貪婪,勉強還是侵占都無法實現 多個分組 并且中間穿插了其他字符的情況
?
固定的800多種組合是可以實現的
?
?
?
固定一種規則是可以的 ?中間沒有問號 ?但是開始位置還是無法確定
?
上面區的情況 和園的情況 都可以長的部分放到前面去解決
?
?
這種和其他混淆度太高 ?直接不用其作為判斷標準 ?刪除好了
?
?
?
?
?
?
?
總結
- 上一篇: 正则体系1
- 下一篇: 机器学习数据不平衡不均衡处理之SMOTE