正则表达式 小结 经典解决方案[1]
目前,正則表達式已經在很多軟件中得到廣泛的應用,包括*nix(Linux, Unix等),HP等操作系統,PHP,C#,Java等開發環境,以及很多的應用軟件中,都可以看到正則表達式的影子。
正則表達式是用來匹配一類字符串的一種模式
正則表達式的功能:字符串的查找、替換以及分割
應用領域廣泛
Perl、PHP、Java、C++、C#、Python、 Xpath、.Net、
JavaScript、Jscript
Oracle、Mysql、Unix、Linux
正則語法:
正則表達式主要組成:
????? 1 原子(普通字符,如英文字符)
????? 2 元字符(有特殊功用的字符)
????? 3 模式修正字符(對正則表達式語義的修正)
一個正則表達式中至少包含一個原子。
===========華麗的分割線=======================
1 原子
原子是組成正則表達式的基本單位,在分析正則表達式時,應作為一個整體。
原子字符包括所有的英文字母、數字、標點符號以及其他一些符號。原子也包括以下內容。
?????????????? 單個字符、數字,如a~z,A~Z,0~9。
? 模式單元,如(ABC)可以理解為由多個原子組成的大的原子。
? 原子表,如 [ABC]。
? 重新使用的模式單元,如:\\1
普通轉義字符,如:\d, \D, \w
?? 轉義元字符,如:\*,\.
2 元字符
元字符是用于構造規則表達式的具有特殊含義的字符。如果要在正則表達式中包含元字符本身,必須在其前加上”\”進行轉義 ?????????????????????????????????????????????????????
元字符?????????????????????? 說明
.??????????????????????????????????? 匹配除換行之外的任何一個字符
*?????????????????????????????????? 0次、1次或多次匹配其前的原子
+?????????????????????????????????? 1次或多次匹配其前的原子
??????????????????????????????????? 0次或1次匹配其前的原子
|?????????????????????????????????? 匹配兩個或多個選擇
^ 或? \A??????????????????????????? 匹配字符串串首的原子
$ 或? \Z ????????????????????????? 匹配字符串串尾的原子
\b???????????????????????????????? 匹配單詞的邊界
\B??????????????????????? 匹配除單詞邊界以外的部分
[]?????????????????????????????????? 匹配方括號中的任一原子
[^xyz]????????????????????????? 匹配除方括號中的原子外的任何字符
{m}????????????????????? 表示其前原子恰好出現m次
{m,n}?????????????????????????? 表示其前原子至少出現m次,至少出現n次(n>m)
{m,}??????????????????? 表示其前原子出現不少于m次
()?????????????????????????????????? 整體表示一個原子
3 模式修正字符
在PCRE表達式中的最后一個分隔符/后,可以添加模式修正符,擴展了正則表達式在字符匹配、替換操作時的某些功能,修正增強了正則表達式的處理能力。模式修正符一般標記于整個模式之外,并且可以組合使用,如“/apple/i”、“/cat|dog/uis”等。
???????? 模式修正符???????????????????????????????? 說明
?????????????????? i????????????????? -可同時匹配大小寫字母
?????????????????? s???????????????? -將字符串視為單行,換行符做普通字符看待,使“.”匹配任何字符
?????????????????? m?????????????? -將字符串視為多行
?????????????????? x???????????????? -模式中的空白忽略不計
?????????????????? S???????????????? - 當一個模式將被使用若干次時,先對其進行分析?
?????????????????? U??????????????? -匹配到最近的字符串
?????????????????? e??????????????? -將替換的字符串作為表達使用
============================華麗分割線==========================
原子說明
--------------------------------------------------------------------------------
\d?????????????? 匹配一個數字;等價于[0-9]
\D????????????? 匹配除數字以外任何一個字符;等價于[^0-9]
\w????????????? 匹配一個英文字母、數字或下劃線;等價于[0-9a-zA-Z_]
\W???????????? 匹配除英文字母、數字和下劃線以外任何一個字符;等價于[^0-9a-zA-Z_]
\s?????????????? 匹配一個空白字符;等價于[\f\n\r\t\v]
\S?????????????? 匹配除空白字符以外任何一個字符;等價于[^\f\n\r\t\v]
\n?????????????? 匹配一個換行符;等價于 \x0a 或 \cJ
\r?????????????? 匹配一個回車符等價于\x0d 或 \cM
\t?????????????? 匹配一個制表符;等價于 \x09\或\cl
\f??????????????? 匹配一個換頁符等價于 \x0c 或 \cL
\v?????????????? 匹配一個垂直制表符;等價于\x0b或\ck
\oNN?????????? 匹配一個八進制數字
\xNN?????????? 匹配一個十六進制數字
\cC???????????? 匹配一個控制字符
例如,在字符串“Tom and Jerry chased each other in the house until tom’s uncel come in”中
元字符“^”或“\A” 置于字符串的開始確保模式匹配出現在字符串首端;
/^Tom/
元字符“$”或“\Z” 置于字符串的結束,確保模式匹配出現字符串尾端。
/in$/?????????
如果不加邊界限制元字符,將獲得更多的匹配結果。
/^Tom$/精確匹配??????????? /Tom/模糊匹配
例如:在字符串“This island is a beautiful land”中
元字符“\b”對單詞的邊界進行匹配;
/\bis\b/??? 匹配單詞“is”,不匹配“This”和“island”。
/\bis/??????? 匹配單詞“is”和“island”中的“is”,不匹配“This”
元字符“\B”對除單詞邊界以外的部分進行匹配。
/\Bis\B/??? 將明確的指示不與單詞的左、右邊界匹配,只匹配單詞 的內部。所以在這個例子中沒有結果。
/\Bis/??????? 匹配單詞“This”中的“is”
轉載于:https://www.cnblogs.com/zcy_soft/archive/2011/08/06/2129488.html
總結
以上是生活随笔為你收集整理的正则表达式 小结 经典解决方案[1]的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: SQL触发器实例讲解1
- 下一篇: 怎么卸载Apache_pn服务-PHPn