微软面试题:正则表达式提取链接地址
寫出正則表達式,從一個字符串中提取鏈接地址。比如下面字符串中
"IT面試題博客中包含很多? <a href=http://hi.baidu.com/mianshiti/blog/category/微軟面試題> 微軟面試題 </a> "
則需要提取的地址為 " http://hi.baidu.com/mianshiti/blog/category/微軟面試題 "
在python中:
import re
p = re.compile('<a(?: [^>]*)+href=([^ >]*)(?: [^>]*)*>')
content = "IT面試題博客中包含很多 <a href=http://hi.baidu.com/mianshiti/blog/category/微軟面試題> 微軟面試題 </a> "
p.search(content).groups()
這段代碼對于給出的例子是足夠了,但實際情況中還需要考慮鏈接地址兩邊的單引號或者雙引號,href的大小寫,情況會稍微復(fù)雜些。
另外,如果面試者對正則表達式完全沒有概念,可以和面試官申請換一道題,一般不會有太大影響。
參考資料:
http://wiki.ubuntu.org.cn/Python正則表達式操作指南
轉(zhuǎn)載于:https://www.cnblogs.com/rollenholt/archive/2012/03/23/2414330.html
總結(jié)
以上是生活随笔為你收集整理的微软面试题:正则表达式提取链接地址的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 适合前端工作者的iPhone Web A
- 下一篇: 学习之模块架构 DotNetNuke 6