转义字符的整理
文章目錄
- 轉義符號 \
- 轉義字符清單
- 換行符
- 橫向制表符
- 空格
- 編碼符
轉義符號 \
反斜杠\在程序設計中稱為轉義符,用來表示那些不能直接顯示的字符。例如:換行。
在不同的系統中換行的表示又不相同,在Unix中換行符是\n,而在Windows中換行符是\r\n(先回車再換行),在Mac中換行是\r。這里的換行符的意思是,當我們使用文本編輯器書寫內容時,當我們完成一行內容(無論主動敲擊回車鍵換行還是文本編輯器自動換行),編輯器會自動在我們每行文本后添加轉義字符(\n或者\r\n或者\r),也就是在每行末尾做個“標記”,當使用編輯器打開時,方便我們查看(這些“標記”我們看不到)。
另外,在Bash中用于去除某些字符的特殊意義,保留跟隨在\之后的字符的字面值,參考示例1。
示例1:
說明:反斜線去除了$字符的特殊意義,保留字面值,從而不輸出HOME變量的值
擴展知識:
路徑和參數的表示符號
- Windows:/是表示參數,\是表示本地路徑
- Linux和Unix:/表示路徑,\表示轉義,-和--表示參數
- 網絡:由于網絡使用Unix標準,所以網絡路徑用/
參考文章:
Linux下反斜杠號""引發的思考
轉義字符清單
| \o | 空字符(NULL) | 00H/0,H 表示十六進制,其實可以寫成 0x00 |
| \n | 換行符(LF, Line Feed) | 0AH/10,十六進制數可以寫成 0x0A,下同 |
| \r | 回車符(CR, Carriage Return) | 0DH/13 |
| \t | 水平制表符(HT, Horizontal Tab) | 09H/9 |
| \v | 垂直制表符(VT, Vertical Tab) | 0BH/11 |
| \a | 響鈴(BEL, Bells) | 07H/7 |
| \b | 退格符(BS, Backspace) | 08H/8 |
| \f | 換頁符(FF, Form Feed) | 0CH/12 |
| \' | 單引號 | 27H/39 |
| \" | 雙引號 | 22H/34 |
| \\ | 反斜杠 | 5CH/92 |
| \? | 問號字符 | 3F/63 |
| \$ | 美元符號 | |
| \ddd | 三位八進制所代表的任意字符 | 三位八進制 |
| \xhh | 二位十六進制數所代表的任意字符 | 二位十六進制 |
換行符
\r是回車,本義是光標重新回到本行開頭,名稱傳承自以前的打字機,表示打印頭歸位,r的英文return,控制字符可以寫成CR,即Carriage Return
\n是換行,本義是光標往下一行(不一定到下一行行首),名稱傳承自以前的打字機,表示走紙另起一行,n的英文newline,控制字符可以寫成LF,即Line Feed
-
Dos和Windows采用回車(CR)+換行(LF)表示下一行,轉義符號:\r\n,具體含義:光標回到本行開頭并往下一行,十六進制ASCII碼:0x0D0A
-
Unix類系統中采用換行(LF)表示下一行,轉義符號:\n,具體含義:光標下一行并回到行首,十六進制ASCII碼:0x0A
-
MAC OS中采用回車(CR)表示下一行,轉義符號:\r,具體含義:光標回到本行開頭并往下一行,十六進制ASCII碼:0x0D
用表格整理如下:
| 換行符 | \r\n | \n | \r |
| ASCII | 0x0D0A | 0x0A | 0x0D |
注意:
vi/vim編輯器中,0x0D0A被表示成^M$($不是換行符的表示,換行符沒有表示出來,$是文本結束EOF的表示),關于這個^M$東西并沒有同時出現過呀,我有疑問!!!
一個直接后果是,Unix/Mac系統下的文件在Windows里打開的話,所有文字會變成一行;而Windows里的文件在Unix下打開(例如vi編輯器)的話,在每行的結尾會出現^M字符。
擴展知識:
關于“回車鍵”的來歷
還得從機械英文打字機說起。在機械英文打字機上,有一個部件叫“字車”,每打一個字符(原為單詞,但是個人覺得這里應該是字符),“字車”就前進一格。當打滿一行字符后,打字者就得推動“字車”到起始位置,這時打字機會有兩個動作響應:一是“字車”被歸位,二是滾筒上卷一行,以便開始輸入下一行,這個推動“字車”的動作叫“回車”。后來,在電動英文打字機上,人們增加了一個直接起“回車”作用的鍵。這個新增的鍵就被稱為“回車鍵”。
在電腦鍵盤上,“回車鍵”上曾經使用過“CR”、“RETURN”的字樣,后來才統一確定為“Enter”。
為什么Windows會使用\r\n作為換行符?
在計算機還沒有出現之前,有一種叫做電傳打字機(Teletype Model 33,Linux/Unix下的tty概念也來自于此)的玩意,每秒鐘可以打10個字符。但是它有一個問題,就是打完一行換行的時候,要用去0.2秒(注:估計是從打字機的最右邊回到最左邊的機械運動 所需要的時間),正好可以打兩個字符。要是在這0.2秒里面,又有新的字符傳過來,那么這個字符將丟失。
于是,研制人員想了個辦法解決這個問題,就是在每行后面加兩個表示結束的字符。一個叫做“回車(Carriage Return)”,告訴打字機把打印頭定位在左邊界;另一個叫做“換行(Line Feed)”,告訴打字機把紙向下移一行。這就是“換行”和“回車”的來歷,從它們的英語名字上也可以看出一二。
橫向制表符
\t:橫向制表符(HT),表示跳到下一個 TAB 位置,也叫水平制表符
\t:是補全當前字符串長度到 8 的整數倍,最少 1 個最多 8 個空格,補多少要看 \t 前字符串長度。
比如當前字符串長度 10,那么 \t 后長度是16,也就是補 6 個空格;如果當前字符串長度 12,此時 \t 后長度是16,補 4 個空格。
空格
半角空格的 Unicode 是:\u0020,代碼中常用的,是英文符號
全角空格的 Unicode 是:\u3000,中文中使用,是中文符號
編碼符
\u,表示Unicode編碼,例如:\u4f60\u597d\uff0c\u4e16\u754c,\u后面的是十六進制數,轉換成二進制數是2個字節(16bit),表示2個字節表示一個字符,這里有5個字符,如下:
public static void main(String[] args) {System.out.println("\u4f60\u597d\uff0c\u4e16\u754c");}得到的實際字符是:
你好,世界
總結
- 上一篇: 飞利浦电脑显示器图片(飞利浦显示器型号大
- 下一篇: 二次元日系网名127个