搞懂树状数组
引用請注明出處:http://blog.csdn.net/int64ago/article/details/7429868
????? 寫下這個標題,其實心里還是沒底的,與其說是寫博帖,不如說是做總結。第一個接觸樹狀數組還是兩年前,用什么語言來形容當時的感覺呢?……太神奇了!真的,無法表達出那種感覺,她是那么的優雅,10行不到的代碼,卻把事情干的如此出色!沒有了解她原理的前提下即使把代碼倒背如流也理解不了!其中,我就是一直沒搞懂地在使用她。時隔兩年,又無意遇到了她,可能是兩年的代碼經驗的積累,有了些新的認識,可以自信的說理解了吧!下面我爭取用自己的方式讓更多人明白她,而不是背誦她。為了更方便的說明,文章里會自己強加一些概念,只是為了更好的理解,不是什么專業術語之類的。
一、樹狀數組是干什么的?
?????? 平常我們會遇到一些對數組進行維護查詢的操作,比較常見的如,修改某點的值、求某個區間的和,而這兩種恰恰是樹狀數組的強項!當然,數據規模不大的時候,對于修改某點的值是非常容易的,復雜度是O(1),但是對于求一個區間的和就要掃一遍了,復雜度是O(N),如果實時的對數組進行M次修改或求和,最壞的情況下復雜度是O(M*N),當規模增大后這是劃不來的!而樹狀數組干同樣的事復雜度卻是O(M*lgN),別小看這個lg,很大的數一lg就很小了,這個學過數學的都知道吧,不需要我說了。申明一下,看下面的文章一定不要急,只需要看懂每一步最后自然就懂了。
二、樹狀數組怎么干的?
??????? 先看兩幅圖(網上找的,如果雷同,不要大驚小怪~),下面的說明都是基于這兩幅圖的,左邊的叫A圖吧,右邊的叫B圖:
????? 是不是很像一顆樹?對,這就是為什么叫樹狀數組了~先看A圖,a數組就是我們要維護和查詢的數組,但是其實我們整個過程中根本用不到a數組,你可以把它當作一個擺設!c數組才是我們全程關心和操縱的重心。先由圖來看看c數組的規則,其中c8 = c4+c6+c7+a8,c6 = c5+a6……先不必糾結怎么做到的,我們只要知道c數組的大致規則即可,很容易知道c8表示a1~a8的和,但是c6卻是表示a5~a6的和,為什么會產生這樣的區別的呢?或者說發明她的人為什么這樣區別對待呢?答案是,這樣會使操作更簡單!看到這相信有些人就有些感覺了,為什么復雜度被lg了呢?可以看到,c8可以看作a1~a8的左半邊和+右半邊和,而其中左半邊和是確定的c4,右半邊其實也是同樣的規則把a5~a8一分為二……繼續下去都是一分為二直到不能分,可以看看B圖。怎么樣?是不是有點二分的味道了?對,說白了樹狀數組就是巧妙的利用了二分,她并不神秘,關鍵是她的巧妙!
?????? 她又是怎樣做到不斷的一分為二呢?說這個之前我先說個叫lowbit的東西,lowbit(k)就是把k的二進制的高位1全部清空,只留下最低位的1,比如10的二進制是1010,則lowbit(k)=lowbit(1010)=0010(2進制),介于這個lowbit在下面會經常用到,這里給一個非常方便的實現方式,比較普遍的方法lowbit(k)=k&-k,這是位運算,我們知道一個數加一個負號是把這個數的二進制取反+1,如-10的二進制就是-1010=0101+1=0110,然后用1010&0110,答案就是0010了!明白了求解lowbit的方法就可以了,繼續下面。介于下面討論十進制已經沒有意義(這個世界本來就是二進制的,人非要主觀的構建一個十進制),下面所有的數沒有特別說明都當作二進制。
?????? 上面那么多文字說lowbit,還沒說它的用處呢,它就是為了聯系a數組和c數組的!ck表示從ak開始往左連續求lowbit(k)個數的和,比如c[0110]=a[0110]+a[0101],就是從110開始計算了0010個數的和,因為lowbit(0110)=0010,可以看到其實只有低位的1起作用,因為很顯然可以寫出c[0010]=a[0010]+a[0001],這就為什么我們任何數都只關心它的lowbit,因為高位不起作用(基于我們的二分規則它必須如此!),除非除了高位其余位都是0,這時本身就是lowbit。
既然關系建立好了,看看如何實現a某一個位置數據跟改的,她不會直接改的(開始就說了,a根本不存在),她每次改其實都要維護c數組應有的性質,因為后面求和要用到。而維護也很簡單,比如更改了a[0011],我們接著要修改c[0011],c[0100],c[1000],這是很容易從圖上看出來的,但是你可能會問,他們之間有申明必然聯系嗎?每次求解總不能總要拿圖來看吧?其實從0011——>0100——>1000的變化都是進行“去尾”操作,又是自己造的詞--'',我來解釋下,就是把尾部應該去掉的1都去掉轉而換到更高位的1,記住每次變換都要有一個高位的1產生,所以0100是不能變換到0101的,因為沒有新的高位1產生,這個變換過程恰好是可以借助我們的lowbit進行的,k +=lowbit(k)。
?????? 好吧,現在更新的次序都有了,可能又會產生新的疑問了:為什么它非要是這種關系啊?這就要追究到之前我們說c8可以看作a1~a8的左半邊和+右半邊和……的內容了,為什么c[0011]會影響到c[0100]而不會影響到c[0101],這就是之前說的c[0100]的求解實際上是這樣分段的區間 c[0001]~c[0001] 和區間c[0011]~c[0011]的和,數字太小,可能這樣不太理解,在比如c[0100]會影響c[1000],為什么呢?因為c[1000]可以看作0001~0100的和加上0101~1000的和,但是0101位置的數變化并會直接作用于c[1000],因為它的尾部1不能一下在跳兩級在產生兩次高位1,是通過c[0110]間接影響的,但是,c[0100]卻可以跳一級產生一次高位1。
???????? 可能上面說的你比較繞了,那么此時你只需注意:c的構成性質(其實是分組性質)決定了c[0011]只會直接影響c[0100],而c[0100]只會直接影響[1000],而下表之間的關系恰好是也必須是k +=lowbit(k)。此時我們就是寫出跟新維護樹的代碼:
void add(int k,int num) {while(k<=n){tree[k]+=num;k+=k&-k;} } ?????? 有了上面的基礎,說求和就比較簡單了。比如求0001~0110的和就直接c[0100]+c[0110],分析方法與上面的恰好逆過來,而且寫法也是逆過來的,具體就不累述了: int read(int k)//1~k的區間和 {int sum=0;while(k){sum+=tree[k];k-=k&-k;}return sum; }三、總結一下吧
????????? 首先,明白樹狀數組所白了是按照二分對數組進行分組;維護和查詢都是O(lgn)的復雜度,復雜度取決于最壞的情況,也是O(lgn);lowbit這里只是一個技巧,關鍵在于明白c數組的構成規律;分析的過程二進制一定要深入人心,當作心目中的十進制。
總結
- 上一篇: Ubuntu14.04安装GNOME3桌
- 下一篇: 物流基础知识(十五)