关关小说采集器规则正则表达式方法
生活随笔
收集整理的這篇文章主要介紹了
关关小说采集器规则正则表达式方法
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
最常用的字符:
1、內容:((.|\n)+?)
2、需要的:(.+?)
3、不需要的:.+?
4、書號:(\d+)
5、不要地址:\d*
6、分頁:{Page}
1. \d* 表示數字
2. \s* 空格或換行
3. .+? 表示不需要的字符
4. .* 表示字符
5. () 表示需要截取的部分
6. ((.|\n)*) 章節內容截取
7. . 表示單個字符
8. $ 表示結束字符 例如正則表達式weasel$ 能夠匹配字符串"He's a weasel"的末尾,但是不能匹配字符串"They are a bunch of weasels."。
9. ^ 表示一行的開始
10. < [^<]*((?<=<(?:img|IMG)[^>]*(?:(?:src|SRC)(?:\s*=\s*(?: ["']?))))(?:[^\s"'>]*)\.(?:jpg|gif|jpeg|bmp|png|GIF|JPG)) [^>]*> 萬能圖片代碼
總結
以上是生活随笔為你收集整理的关关小说采集器规则正则表达式方法的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: ASP.NET MVC数据验证(上)
- 下一篇: python 三维向量 交互_Blend