了解下C#由转换二进制所引起的思考
【導讀】最近遇到很有意思轉換二進制的問題,有部分童鞋儼然已了解,可能也有一部分童鞋沒碰到過也就不知情,這里我們來深入學習下轉換二進制所帶來的問題。
在寫此篇文章時,非常開心,收到再一次連任MVP的郵件,這是我第4年連任,希望能再接再厲,一如既往能夠給大家分享我所獲
二進制轉換問題
假設現在我們有一個int類型的數據,它的范圍區間暫且定在0-15之間,我們需要將其轉換為二進制,然后獲取二進制中的每一位,若不足4位則0填充。看似很簡單是不是,直接通過C#內置APi即可達到此需求,如下:
上述將數字7轉換為包含二進制位的字符串數組形式,7轉換二進制然后不足4位以0填充即(0111),我們如下獲取二進制位字符串數組為索引的位,結果應該打印出0,對嗎?
var?zerobit?=?binary[0]; Console.WriteLine(zerobit);好像一點毛病也沒有,這是在控制臺中進行打印,若是將該數據導出到Excel中,你會發現結果將可能是48或49而不是0或1(你可以一試)這是因為如下:
我們通過調試可知實際上在字符0上還攜帶有48,這個48實際上是字符0的ASCII碼,字符1的ASCII碼是49,通過如下代碼即可證明:
foreach?(var?b?in?System.Text.Encoding.UTF8.GetBytes(binary)) {Console.WriteLine(b.ToString()); }我們對將對應字符數組索引數據進行如下ToString轉換即可避免導出數據時可能出現的問題
var?zerobit?=?binary[0]; Console.WriteLine(zerobit.ToString());轉換字符數組問題
當我們轉換為字符數組時,有兩種方式,既可采用上述ToArray方法,也可以通過ToCharArray方法來實現,如下,那么哪種方法會更好呢?
此時比較此二者方法的性能好壞,只能去看對應源碼實現,首先我們來看看ToCharArray方法,如下:
上述對于ToCharArray代碼量還是不多,我們來看看ToArray方法實現,如下:
上述只是寫了一個擴展方法,我們繼續往下看Buffer類的具體實現,如下:
從代碼量上看就覺得ToArray方法實現稍微復雜一點,所以我們選擇使用ToCharArray會更好,我要是如此草草結束此文,一定會噴。
原歸正傳,我們一步步來分析,如上做了一點優化,首先會判斷參數是否屬于集合接口,若是則直接通過復制轉換為數組形式,但是我們知道字符串肯定沒有實現ICollection<T>接口,所以走另外一個條件分支,但是有的童鞋可能就有疑問了,此時為何可以遍歷呢?那是因為針對字符實現了IEnumerable<char>接口,所以可以進行遍歷,如下
接下來則是初始化容量為4的數組,為何這里為4呢?這里我認為應該談不上優化,與其說是實現者的一種拍腦袋的想法,我傾向于理解為是一種權衡或考量,既然轉到此分支說明一定是轉換為二進制位的數組,比如上述進行填充后長度剛好為4。再接下來無用我再多講,就是遍歷所有字符數組,將每一個字符串添加到數組中去,直到數組長度和變量值(num)相等最終進行一次性復制,最終將數組賦值給數組元素以及將變量num賦值給數組元素的數量(count)。?
?
好了,講解了這么多,那么問題來了,到底誰的性能會更好呢?
ToCharArray方法實現底層采用指針操作轉化為字符數組,而利用ToArray方法由于string沒有實現ICollection<T>接口,也就是說根本不清楚字符串中字符數組的長度,所以只能采取低效遍歷的方式去進行轉換,我們可認為通過中間緩沖區的方式(即上述通過實例化數組作為橋梁最終進行復制)實現。
由此得出,在將字符串轉換為字符數組時,一定要用ToCharArray方法而不是ToArray,ToCharArray性能優于ToArray方法,我不禁在想,針對字符轉換為數組只提供ToCharArray方法不就好了么,為何還要提供ToArray方法,讓人容易產生誤會,它的場景難道還有其他嗎?
本文詳細講解了在轉換二進制數據所引發的一點個人思考,在將字符串轉換為字符數組時,通過方法名稱意思可能直接就用ToCharArray方法,但是又偏偏提供了字符串的ToArray方法,其本質是針對字符數組的擴展方法,如果對源碼不了解的話,根本就不清楚到底應該用哪一個,從性能角度講,ToCharArray方法優于ToArray方法,至于最終用哪一個,你說了算。
總結
以上是生活随笔為你收集整理的了解下C#由转换二进制所引起的思考的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 搭建一套ASP.NET Core+Nac
- 下一篇: 如何利用.NETCore向Azure E