收集正则
? ?過(guò)濾所有非中文非英文字符 :replaceAll("[^\\u4e00-\\u9fa5|A-Za-z]", " ")
? 過(guò)濾標(biāo)點(diǎn)符號(hào):replaceAll("[\\pP‘’“”]", " ")
判斷獲得的每個(gè)字符的unicode編碼,漢字是有范圍的,具體是\u4E00-\u9FA5 和 \uF900-\uFA2D 不在這個(gè)范圍中的就不是漢字。 \u表示是16進(jìn)制轉(zhuǎn)載于:https://www.cnblogs.com/linchuxin/archive/2012/03/16/2400673.html
總結(jié)
- 上一篇: IIS+php无法上传图片(转载自htt
- 下一篇: VS 2005 不能调试无法找到调试信息