Java如何判断字符串中包含有全角,半角符号
一、全角跟半角之間的區別
在計算機屏幕上,一個漢字要占兩個英文字符的位置,人們把一個英文字符所占的位置稱為”半角”,相對地把一個漢字所占的位置稱為”全角”。在漢字輸入時,系統提供”半角”和”全角”兩種不同的輸入狀態,但是對于英文字母、符號和數字這些通用字符就不同于漢字,在半角狀態它們被作為英文字符處理;而在全角狀態,它們又可作為中文字符處理。半角和全角切換方法:單擊輸入法工具條上的按鈕或按鍵盤上的Shift+Space鍵來切換。
1、全角:指一個字符占用兩個標準字符位置。
漢字字符和規定了全角的英文字符及國標GB2312-80中的圖形符號和特殊字符都是全角字符。一般的系統命令是不用全角字符的,只是在作文字處理時才會使用全角字符。
2、半角:指一字符占用一個標準的字符位置。
通常的英文字母、數字鍵、符號鍵都是半角的,半角的顯示內碼都是一個字節。在系統內部,以上三種字符是作為基本代碼處理的,所以用戶輸入命令和參數時一般都使用半角。
3、全角與半角各在什么情況下使用?
全角占兩個字節,半角占一個字節。
半角全角主要是針對標點符號來說的,全角標點占兩個字節,半角占一個字節,而不管是半角還是全角,漢字都還是要占兩個字節。
在編程序的源代碼中只能使用半角標點(不包括字符串內部的數據)
在不支持漢字等語言的計算機上只能使用半角標點(其實這種情況根本就不存在半角全角的概念)
對于大多數字體來說,全角看起來比半角大,當然這不是本質區別了。
4、全角和半角的區別
全角就是字母和數字等與漢字占等寬位置的字。半角就是ASCII方式的字符,在沒有漢字輸入法起做用的時候輸入的字母數字和字符都是半角的。
在漢字輸入法出現的時候,輸入的字母數字默認為半角,但是標點則是默認為全角,可以通過鼠標點擊輸入法工具條上的相應按鈕來改變。
5、關于“全角”和“半角”:
全角:是指中GB2312-80(《信息交換用漢字編碼字符集·基本集》)中的各種符號。
半角:是指英文件ASCII碼中的各種符號。
全角狀態下字母、數字符號等都會占兩個字節的位置,也就是一個漢字那么寬,半角狀態下,字母數字符號一般會占一個字節,也就是半個漢字的位置,全角半角對漢字沒有影響。
?
二、java編程語言中如何來判斷字符串中的全角半角符號
??? 有兩種方式可以判斷:
?? 1. 通過正則表達式來進行判斷? [^\\x00-\\xff]
?? 2. 通過字符編碼的范圍進行判斷.
?????? 有關字符編碼的范圍介紹如下:
?????????????? 我們可以編寫一個測試用例輸出所有的字符編碼。
???? ? public static void main(String[] args) {
?????????????????? for (int i = Character.MIN_VALUE; i <= Character.MAX_VALUE; ++i) {
?????????? ? ? ?? System.out.println(i + “??? ” + (char)i);
?????? ? ?? }
?? ??? }
測試結果如下:(截取部分圖)
經過測試發現:
1.半角字符是從33開始到126結束
2.與半角字符對應的全角字符是從65281開始到65374結束
3.其中半角的空格是32.對應的全角空格是12288
半角和全角的關系很明顯,除空格外的字符偏移量是65248(65281-33 = 65248)
?
// 測試用例1———-使用正則表達式
?? ??? ?// 純半角,包含有數字,字母,特殊符號,空格,漢字
?? ??? ?String test1 = “0123456789abcde!@#$%^& 幽雨”;
?? ??? ?char[] chars_test1 = test1.toCharArray();
?? ?? ? for (int i = 0; i < chars_test1.length; i++) {
?? ??? ??? ?String temp = String.valueOf(chars_test1[i]);
?? ??? ??? ?// 判斷是全角字符
?? ??? ??? ?if (temp.matches(“[^\\x00-\\xff]“)) {
?? ??? ??? ??? System.out.println(“全角?? ” + temp);
?? ??? ??? ?}
?? ??? ??? ?// 判斷是半角字符
?? ??? ??? ?else {
?? ??? ??? ??? System.out.println(“半角??? ” + temp);
?? ??? ??? ?}
?? ??? ?}
?測試結果如下:
?
// 測試用例2———-使用正則表達式
?? ??? // 純全角,包含有數字,字母,特殊符號,空格,漢字
?? ??? ?String test2 = “0123456789abcde!@#$%^& 幽雨”;
?? ??? ?char[] chars_test2 = test2.toCharArray();
?? ?? ? for (int i = 0; i < chars_test2.length; i++) {
?? ??? ??? ?String temp = String.valueOf(chars_test2[i]);
?? ??? ??? ?// 判斷是全角字符
?? ??? ??? ?if (temp.matches(“[^\\x00-\\xff]”)) {
?? ??? ??? ??? System.out.println(“全角?? ” + temp);
?? ??? ??? ?}
?? ??? ??? ?// 判斷是半角字符
?? ??? ??? ?else {
?? ??? ??? ??? System.out.println(“半角??? ” + temp);
?? ??? ??? ?}
?? ??? ?}
?測試結果如下:
?
// 測試用例3-———使用正則表達式
?? ??? // 混合,包含有數字,字母,特殊符號,空格,漢字
?? ??? ?String test3 = “0123456789abcde!@#$%^& 幽雨0123456789abcde!@#$%^& 幽雨”;
?? ??? ?char[] chars_test3 = test3.toCharArray();
?? ?? ? for (int i = 0; i < chars_test3.length; i++) {
?? ??? ??? ?String temp = String.valueOf(chars_test3[i]);
?? ??? ??? ?// 判斷是全角字符
?? ??? ??? ?if (temp.matches(“[^\\x00-\\xff]”)) {
?? ??? ??? ??? System.out.println(“全角?? ” + temp);
?? ??? ??? ?}
?? ??? ??? ?// 判斷是半角字符
?? ??? ??? ?else {
?? ??? ??? ??? System.out.println(“半角??? ” + temp);
?? ??? ??? ?}
?? ??? ?}
?測試結果如下:
???
這里介紹下如果不想要字符串中的漢字的話,可以使用正則表達式將之去除:? [\u4e00-\u9fa5]
測試用例4:
去除字符串中漢字
String ss = “waeaeaea我們women在這里”;
System.out.println(ss.replaceAll(“[\u4e00-\u9fa5]”, “”));
測試結果如下:不管是全角還是半角下的漢字
?
或者是截取出字符串中的漢字
?
String ss = “waeaeaea我們women在這里”;
char[] chars_ss = ss.toCharArray();
String test = “”;
for (int i = 0; i < chars_ss.length; i++) {
?? ??? ??? ?String temp = String.valueOf(chars_ss[i]);
?? ??? ??? ?// 判斷是漢字
?? ??? ??? ?if (temp.matches(“[\u4e00-\u9fa5]”)) {
?? ??? ??? ??? ?test += temp;
?? ??? ??? ?}
??? }
? System.out.println(test);
測試結果如下:
測試用例5——–使用字符的unicode碼進行判斷
// 純半角,包含有數字,字母,特殊符號,空格,漢字
?? ??? ?String test1 = “0123456789abcde!@#$%^& 幽雨”;
// 首先將漢字用空格替換掉
?? ??? ?test1 = test1.replaceAll(“[\u4e00-\u9fa5]”, “”);
??????? char[] chars_test1 = test1.toCharArray();
?? ??? ?for (int i = 0; i < chars_test1.length; i++) {
?? ??? ??? ?int charValue = (int) chars_test1[i];
?? ??? ??? ?// 判斷是全角字符
?? ??? ??? ?if (charValue >= 65281 && charValue <= 65374 || charValue == 12288) {
?? ??? ??? ??? ?System.out.println(“全角? ” + (char) charValue);
?? ??? ??? ?}
?? ??? ??? ?// 判斷是半角字符
?? ??? ??? ?else if (charValue >= 33 && charValue <= 126 || charValue == 32) {
?? ??? ??? ??? ?System.out.println(“半角? ” + (char) charValue);
?? ??? ??? ?}
?? ??? ?}
測試結果如下:
測試用例6——–使用字符的unicode碼進行判斷
// 純全角,包含有數字,字母,特殊符號,空格,漢字
?? ??? ?String test2 = “0123456789abcde!@#$%^& 幽雨”;
// 首先將漢字用空格替換掉
?? ??? ?test2 = test2.replaceAll(“[\u4e00-\u9fa5]”, “”);
??????? char[] chars_test2 = test2.toCharArray();
?? ??? ?for (int i = 0; i < chars_test2.length; i++) {
?? ??? ??? ?int charValue = (int) chars_test2[i];
?? ??? ??? ?// 判斷是全角字符
?? ??? ??? ?if (charValue >= 65281 && charValue <= 65374 || charValue == 12288) {
?? ??? ??? ??? ?System.out.println(“全角? ” + (char) charValue);
?? ??? ??? ?}
?? ??? ??? ?// 判斷是半角字符
?? ??? ??? ?else if (charValue >= 33 && charValue <= 126 || charValue == 32) {
?? ??? ??? ??? ?System.out.println(“半角? ” + (char) charValue);
?? ??? ??? ?}
?? ??? ?}
?測試結果如下:
測試用例7-——-使用字符的unicode碼進行判斷
// 混合,包含有數字,字母,特殊符號,空格,漢字
?? ??? ?String test3 = “0123456789abcde!@#$%^& 幽雨0123456789abcde!@#$%^& 幽雨”;
// 首先將漢字用空格替換掉
?? ??? ?test3 = test3.replaceAll(“[\u4e00-\u9fa5]”, “”);
??????? char[] chars_test3 = test3.toCharArray();
?? ??? ?for (int i = 0; i < chars_test3.length; i++) {
?? ??? ??? ?int charValue = (int) chars_test3[i];
?? ??? ??? ?// 判斷是全角字符
?? ??? ??? ?if (charValue >= 65281 && charValue <= 65374 || charValue == 12288) {
?? ??? ??? ??? ?System.out.println(“全角? ” + (char) charValue);
?? ??? ??? ?}
?? ??? ??? ?// 判斷是半角字符
?? ??? ??? ?else if (charValue >= 33 && charValue <= 126 || charValue == 32) {
?? ??? ??? ??? ?System.out.println(“半角? ” + (char) charValue);
?? ??? ??? ?}
?? ??? ?}
?測試結果如下:
?
?
總結
以上是生活随笔為你收集整理的Java如何判断字符串中包含有全角,半角符号的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 白痴的午夜记叙
- 下一篇: 3款养生保健粥护理肠胃保健康