php正则获取标签,PHP通过正则匹配中文字符 过滤html标签 获取文本内容
正則匹配中文漢字根據頁面編碼不同而略有區別:
GBK/GB2312編碼:[x80-xff]+ 或 [xa1-xff]+
UTF-8編碼:[x{4e00}-x{9fa5}]+/u
[php]
$str = "賬單123";
//GBK/GB2312使用:
preg_match_all("/[\x80-\xff]+/", $str, $chinese);
//UTF-8 使用:
//preg_match_all("/[\x{4e00}-\x{9fa5}]+/u", $str, $chinese);
print_r($chinese);
[/php]
文檔標題沒加utf-8編碼標識:
文檔編碼非utf-8,這個使用編輯器另存為即可;
你的字符串來源非utf-8,比如是從別處抓取而來,比如是從文件中讀取而來,而非在自己的頁面上定義,那么這個字符串自然就是源頭處的編碼了,可以使用PHP轉碼:
string iconv ( string $in_charset , string $out_charset , string $str )
第一個參數:內容原的編碼
第二個參數:目標編碼
第三個參數:要轉的字符串
函數返回字符串
string mb_convert_encoding ( string $str , string $to_encoding [, mixed $from_encoding ] )
第一個參數:要處理的字符串
第二個參數:目標編碼
第三個參數:內容原編碼
函數返回字符串
創作挑戰賽新人創作獎勵來咯,堅持創作打卡瓜分現金大獎總結
以上是生活随笔為你收集整理的php正则获取标签,PHP通过正则匹配中文字符 过滤html标签 获取文本内容的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 16核心锐龙9 5950X硬塞入笔记本:
- 下一篇: 购置税如何计算