【Python】正则表达式使用、常用匹配表达式
生活随笔
收集整理的這篇文章主要介紹了
【Python】正则表达式使用、常用匹配表达式
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
示例
需要把開頭的字母分離出來,比如 AA1234,D111,ERR1,得到AA,D,ERR,示例如下:
import remystr = 'SR123' pattern = re.compile('^[a-zA-Z]+') # 正則匹配開頭所有字母 match = pattern.findall(mystr) # 返回匹配列表 # current_app.logger.info("In contractcode_over, REGEX match is :"+str(match)) p_code = match[0] # 取到SR常用匹配
1、匹配中文:[\u4e00-\u9fa5]2、英文字母:[a-zA-Z]3、數字:[0-9]4、匹配中文,英文字母和數字及下劃線:^[\u4e00-\u9fa5_a-zA-Z0-9]+$ 同時判斷輸入長度: [\u4e00-\u9fa5_a-zA-Z0-9_]{4,10}5、 (?!_) 不能以_開頭 (?!.*?_$) 不能以_結尾 [a-zA-Z0-9_\u4e00-\u9fa5]+ 至少一個漢字、數字、字母、下劃線 $ 與字符串結束的地方匹配6、只含有漢字、數字、字母、下劃線,下劃線位置不限: ^[a-zA-Z0-9_\u4e00-\u9fa5]+$7、由數字、26個英文字母或者下劃線組成的字符串 ^\w+$8、2~4個漢字 "^[\u4E00-\u9FA5]{2,4}$";9、最長不得超過7個漢字,或14個字節(數字,字母和下劃線)正則表達式 ^[\u4e00-\u9fa5]{1,7}$|^[\dA-Za-z_]{1,14}$10、匹配雙字節字符(包括漢字在內):[^x00-xff] 評注:可以用來計算字符串的長度(一個雙字節字符長度計2,ASCII字符計1)11、匹配空白行的正則表達式:ns*r 評注:可以用來刪除空白行12、匹配HTML標記的正則表達式:<(S*?)[^>]*>.*?|<.*? /> 評注:網上流傳的版本太糟糕,上面這個也僅僅能匹配部分,對于復雜的嵌套標記依舊無能為力13、匹配首尾空白字符的正則表達式:^s*|s*$ 評注:可以用來刪除行首行尾的空白字符(包括空格、制表符、換頁符等等),非常有用的表達式14、匹配Email地址的正則表達式:^[a-zA-Z0-9][\w\.-]*[a-zA-Z0-9]@[a-zA-Z0-9][\w\.-]*[a-zA-Z0-9]\.[a-zA-Z][a-zA-Z\.]*[a-zA-Z]$評注:表單驗證時很實用15、手機號:^((13[0-9])|(14[0-9])|(15[0-9])|(17[0-9])|(18[0-9]))\d{8}$16、身份證:(^\d{15}$)|(^\d{17}([0-9]|X|x)$)17、匹配網址URL的正則表達式:[a-zA-z]+://[^s]* 評注:網上流傳的版本功能很有限,上面這個基本可以滿足需求18、匹配帳號是否合法(字母開頭,允許5-16字節,允許字母數字下劃線):^[a-zA-Z][a-zA-Z0-9_]{4,15}$ 評注:表單驗證時很實用19、匹配國內電話號碼:d{3}-d{8}|d{4}-d{7} 評注:匹配形式如 0511-4405222 或 021-8788882220、匹配騰訊QQ號:[1-9][0-9]{4,} 評注:騰訊QQ號從10000開始21、匹配中國郵政編碼:[1-9]d{5}(?!d) 評注:中國郵政編碼為6位數字22、匹配身份證:d{15}|d{18} 評注:中國的身份證為15位或18位23、匹配ip地址:d+.d+.d+.d+ 評注:提取ip地址時有用24、匹配特定數字: ^[1-9]d*$ //匹配正整數 ^-[1-9]d*$ //匹配負整數 ^-?[1-9]d*$ //匹配整數 ^[1-9]d*|0$ //匹配非負整數(正整數 + 0) ^-[1-9]d*|0$ //匹配非正整數(負整數 + 0) ^[1-9]d*.d*|0.d*[1-9]d*$ //匹配正浮點數 ^-([1-9]d*.d*|0.d*[1-9]d*)$ //匹配負浮點數 ^-?([1-9]d*.d*|0.d*[1-9]d*|0?.0+|0)$ //匹配浮點數 ^[1-9]d*.d*|0.d*[1-9]d*|0?.0+|0$ //匹配非負浮點數(正浮點數 + 0) ^(-([1-9]d*.d*|0.d*[1-9]d*))|0?.0+|0$ //匹配非正浮點數(負浮點數 + 0) 評注:處理大量數據時有用,具體應用時注意修正25、匹配特定字符串: ^[A-Za-z]+$ //匹配由26個英文字母組成的字符串 ^[A-Z]+$ //匹配由26個英文字母的大寫組成的字符串 ^[a-z]+$ //匹配由26個英文字母的小寫組成的字符串 ^[A-Za-z0-9]+$ //匹配由數字和26個英文字母組成的字符串 ^w+$ //匹配由數字、26個英文字母或者下劃線組成的字符串26、 在使用RegularExpressionValidator驗證控件時的驗證功能及其驗證表達式介紹如下: 只能輸入數字:“^[0-9]*$” 只能輸入n位的數字:“^d{n}$” 只能輸入至少n位數字:“^d{n,}$” 只能輸入m-n位的數字:“^d{m,n}$” 只能輸入零和非零開頭的數字:“^(0|[1-9][0-9]*)$” 只能輸入有兩位小數的正實數:“^[0-9]+(.[0-9]{2})?$” 只能輸入有1-3位小數的正實數:“^[0-9]+(.[0-9]{1,3})?$” 只能輸入非零的正整數:“^+?[1-9][0-9]*$” 只能輸入非零的負整數:“^-[1-9][0-9]*$” 只能輸入長度為3的字符:“^.{3}$” 只能輸入由26個英文字母組成的字符串:“^[A-Za-z]+$” 只能輸入由26個大寫英文字母組成的字符串:“^[A-Z]+$” 只能輸入由26個小寫英文字母組成的字符串:“^[a-z]+$” 只能輸入由數字和26個英文字母組成的字符串:“^[A-Za-z0-9]+$” 只能輸入由數字、26個英文字母或者下劃線組成的字符串:“^w+$” 驗證用戶密碼:“^[a-zA-Z]w{5,17}$”正確格式為:以字母開頭,長度在6-18之間, 只能包含字符、數字和下劃線。 驗證是否含有^%&',;=?$"等字符:“[^%&',;=?$x22]+” 只能輸入漢字:“^[u4e00-u9fa5],{0,}$” 驗證Email地址:“^w+[-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*$” 驗證InternetURL:“^http://([w-]+.)+[w-]+(/[w-./?%&=]*)?$” 驗證身份證號(15位或18位數字):“^d{15}|d{}18$” 驗證一年的12個月:“^(0?[1-9]|1[0-2])$”正確格式為:“01”-“09”和“1”“12” 驗證一個月的31天:“^((0?[1-9])|((1|2)[0-9])|30|31)$” 正確格式為:“01”“09”和“1”“31”。 匹配中文字符的正則表達式: [u4e00-u9fa5] 匹配雙字節字符(包括漢字在內):[^x00-xff] 匹配空行的正則表達式:n[s| ]*r 匹配HTML標記的正則表達式:/<(.*)>.*|<(.*) />/ 匹配首尾空格的正則表達式:(^s*)|(s*$) 匹配Email地址的正則表達式:w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)* 匹配網址URL的正則表達式:http://([w-]+.)+[w-]+(/[w- ./?%&=]*)?總結
以上是生活随笔為你收集整理的【Python】正则表达式使用、常用匹配表达式的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【Python】解决TypeError:
- 下一篇: 【SPSS】第十周-面板数据的线性回归