c++代码转为go_Go语言学习笔记六--string编码
生活随笔
收集整理的這篇文章主要介紹了
c++代码转为go_Go语言学习笔记六--string编码
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
分解探索string編碼
轉為byte數組
func main() {s := "Hi小智加油!"fmt.Println("len(s):",len(s)) //len(s): 15 為什么是15呢?for _, v := range []byte(s) {fmt.Printf("%X ",v) //%X 轉為16進制//48 69 E5 B0 8F E6 99 BA E5 8A A0 E6 B2 B9 21//猜測從第三個開始(E5 B0 8F) -> 小 ,后面都是三個字節代表一個漢字//其實utf-8 是使用的可變長度來編碼的(世界上這么多語言,如果全部都是3個直接來編碼,太浪費空間)} }通過打印我們猜測,這個byte數組中,中文漢字是使用3個字節來編碼
直接遍歷string
驗證:上述猜想
func main() {for k, v := range s { //v is a runefmt.Printf("(%d,%X)",k,v)//(0,48)(1,69)(2,5C0F)(5,667A)(8,52A0)(11,6CB9)(14,21)} }如圖for k, v := range s的v是一個int32類型:
發現從第三個開始漢字,下標正確2,但是下一個就變成了5,這說明,上面轉為byte數組時我們的猜想是正確的, 一個漢字使用了3個byte來表示,但是這樣遍歷 根本不是我們想要的,因為下標的問題.
總結:既 直接遍歷字符串時,k 為 byte數組的下標 而 v 卻是int32類型(rune)
utf8工具類解碼
//使用 utf8工具類fmt.Println("s rune counts:",utf8.RuneCountInString(s))//s rune counts: 7 ,發現是s的長度是我們想要的了既然可以得到正確的長度了,嘗試一個字一個字解碼
bytes := []byte(s)for len(bytes)>0 {ch, size := utf8.DecodeRune(bytes) //解碼byte數組 返回rune和size長度bytes = bytes[size:] //截取bytefmt.Printf("%c " ,ch)} H i 小 智 加 油 ! //發現每個字符都被解碼出來了結論
在go中,rune就相當于Java中的char,而rune是uft8編碼
正常遍歷一個string的方法
fmt.Println();for k, v := range []rune(s) { //直接將string轉為rune切片fmt.Printf("(%d %c)",k,v) //%c 可以將rune轉為 字符串} (0 H)(1 i)(2 小)(3 智)(4 加)(5 油)(6 !) 得到了我們想要的答案.TEST:查找到一個字符串中最長不重復字符串(國際版)
這里直接跳過了這個test的解題思路,如果沒有看過的同學, 點擊上篇查看
func findMaxNoRepeatString(s string) int {start := 0keysIndex := make(map[rune]int)lenth := 0for i, v := range []rune(s) { //將byte換成rune即可lastIndex, ok := keysIndex[v]if ok && lastIndex >= start {start = lastIndex + 1} else {lenth = i - start + 1}keysIndex[v] = i}return lenth }作者所有的學習源碼在 go學習源碼github地址,如果覺得有用的話幫小智貢獻一個star
總結
以上是生活随笔為你收集整理的c++代码转为go_Go语言学习笔记六--string编码的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 学徒学计算机,那个有能力的高人愿意收我做
- 下一篇: transformer论文解读_【论文解