當(dāng)前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

聊聊 MySql 索引那些事儿

發(fā)布時間：2025/3/21 编程问答 21 豆豆

生活随笔收集整理的這篇文章主要介紹了聊聊 MySql 索引那些事儿小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

來源：my.oschina.net/luozhou/blog/3030583

概述

上一篇文章《一條SQL語句在MySQL中是如何執(zhí)行的》我們聊到了sql語句內(nèi)部的執(zhí)行，包括InnoDB引擎是如何支持事務(wù)的，如何做到可以備份恢復(fù)的，那么今天我們來聊一聊MySql索引的那些事，在這篇文章中，我會主要聊聊InnoDB下索引的數(shù)據(jù)結(jié)構(gòu)，索引如何起作用的，如何更好的利用索引提高效率。

一、什么是索引

數(shù)據(jù)庫索引，是數(shù)據(jù)庫管理系統(tǒng)中一個排序的數(shù)據(jù)結(jié)構(gòu)，以協(xié)助快速查詢、更新數(shù)據(jù)庫表中數(shù)據(jù)。就像我們以前用的新華字典的目錄一樣，能幫助我們快速查詢到某一個字。

二、索引的分類

分類角度索引名稱

數(shù)據(jù)結(jié)構(gòu)	B+樹，Hash索引，R-Tree等
存儲層面	聚簇索引，非聚簇索引
邏輯層面	主鍵索引，普通索引，復(fù)合索引，唯一索引，空間索引等

三、索引實例分析(以InnoDB為例)

3.1 InnoDB下索引的結(jié)構(gòu)

InnoDB下，表都是根據(jù)主鍵順序以索引的形式存放的，這種數(shù)據(jù)存儲方式也被稱為聚簇索引，“聚簇”就是表示數(shù)據(jù)行和相鄰的鍵值緊湊的存儲在一起，也就是數(shù)據(jù)行實際上是存儲在索引的葉子頁中。我們創(chuàng)建一張表來實際說明下InnoDB下的索引結(jié)構(gòu)，建表語句如下：

create table person( id int primary key, age int not null index (age)engine=InnoDB;

然后我們插入五條數(shù)據(jù)分別為(1,15),(2,17),(6,20),(10,18),(19,21)，索引的樹結(jié)構(gòu)如下：

上圖中展示了兩部分內(nèi)容，第一個圖為聚簇索引（主鍵索引）的內(nèi)容，可以看到，數(shù)據(jù)按照Id的大小排序，對應(yīng)的索引會包含該索引的整行數(shù)據(jù)。

第二個圖展示了用age做索引的索引結(jié)構(gòu)圖，也就是非聚簇索引（非主鍵索引），可以看到索引以年齡排序，但是和主鍵索引不同的是，年齡索引對應(yīng)的卻是Id，所以我們可以知道非主鍵索引記錄的內(nèi)容就是主鍵索引的值。

這里可能有同學(xué)會有疑問，如果我建表的時候沒有指定主鍵的話，索引結(jié)構(gòu)又是如何的呢？其實在InnoDB中，如果沒有定義主鍵，那么他會選擇一個唯一的非空索引代替。如果沒有這樣的索引，那么他會隱式的定義一個主鍵來作為聚簇索引。所以無論你是否設(shè)置主鍵，InnoDB還是會幫你滿足以上圖的形式來索引數(shù)據(jù)。接下來我們分析下索引查詢的流程。

3.2 索引查詢分析

假設(shè)我們執(zhí)行一條查詢語句?select * from person where ID = 6,因為直接使用的是主鍵ID查詢，所以就會用主鍵索引，由于主鍵索引直接關(guān)聯(lián)了整行所有數(shù)據(jù)，所以，引擎只要執(zhí)行一次就能查詢出結(jié)果。

如果執(zhí)行的sql語句是非主鍵索引

select * from person where age = 18

上述語句會走age的普通索引，索引先根據(jù)age搜索等于18的索引記錄，找到ID=10的記錄，然后再到主鍵索引搜索一次，然后拿出需要查詢的數(shù)據(jù)。

從普通索引查出主鍵索引，然后查詢出數(shù)據(jù)的過程叫做回表。由于回表需要多執(zhí)行一次查詢，這也是為什么主鍵索引要比普通索引要快的原因，所以，我們要盡量使用主鍵查詢。

3.3 覆蓋索引

我們通常創(chuàng)建索引的依據(jù)都是根據(jù)查詢的where條件，但是這只是我們通常的做法，我們根據(jù)上面的分析可以知道，如果要想查詢效率高，第一，使用主鍵索引，第二，避免回表，也就是盡可能的在索引中就能獲取想要的數(shù)據(jù)。如果一個索引包含了需要查詢的字段，那么我們就叫做“覆蓋索引”。

那么如何建立一個覆蓋索引呢？答案是通過聯(lián)合索引來實現(xiàn)，通過聯(lián)合索引的字段來覆蓋要查詢的字段，從而達(dá)到索引覆蓋的效果。

我們把上面的建表語句改造下，來分析下如何實現(xiàn)覆蓋索引。

CREATE TABLE `person` (`id` int(11) NOT NULL,`age` int(11) DEFAULT NULL,`name` varchar(20) DEFAULT NULL,`sex` varchar(1) DEFAULT NULL,PRIMARY KEY (`id`),KEY `name_age` (`name`,`age`) ) ENGINE=InnoDB DEFAULT CHARSET=latin1;

上面我創(chuàng)建了一個name和age的聯(lián)合索引，索引結(jié)構(gòu)圖表示如下：

我們根據(jù)圖可以知道，聯(lián)合索引是和創(chuàng)建索引字段順序有關(guān)的，上面這個例子就是先以name排序，然后name相同再以age為標(biāo)準(zhǔn)排序。那么我們建表后該如何達(dá)到覆蓋索引的效果呢？相信有些同學(xué)已經(jīng)知道了怎么寫sql可以達(dá)到覆蓋索引效果，sql如下：

select name,age from person where name = "Barry"

因為我們需要查詢的字段name和age，都在索引中可以直接查詢到了，所以不需要查找到主鍵ID，然后再回表了。

看到這里，肯定有同學(xué)會說，既然這樣的話，我把所有需要查詢的字段組合都建上聯(lián)合索引不就行了嗎？答案是：不行。因為索引也是需要消耗空間的，而且維護(hù)索引也是需要成本的，這一點(diǎn)我會在后面的優(yōu)缺點(diǎn)中提到。那么有沒有別的方式可以盡可能的實現(xiàn)不回表的效果呢？這里我們就要引入MySql的最左前綴原則了。

什么叫最左前綴原則呢？就是在索引的匹配中，可以以索引的最左N個字段,也可以是字符串索引的最左N個字符。比如在上圖中，要查詢以A開頭的名字，查詢語句就是

select name from person where name like 'A%'

這個時候就可以滿足最左前綴規(guī)則來使用索引查詢了，這里就會依賴索引查詢到第一個首字母是A的名字，然后向后遍歷，直到不滿足條件為止。

那么最左N個字段是什么意思呢？意思就是索引（name,age),可以直接利用?name來當(dāng)做單獨(dú)索引使用，可以只使用聯(lián)合索引的部分字段，但是必須是順序一致，比如索引（a,b,c)，如果要想使用最左前綴規(guī)則，可以使用索引a,ab。

我們也可以利用該規(guī)則來少維護(hù)一個或多個索引，比如我們需要?a,ab,abc的查詢，那就只需要(a,b,c)聯(lián)合索引就滿足要求了。

3.4 索引下推

在MySql 5.6版本中引入了一個新特性，叫做“索引條件推送（index condition pushdown)”，這也稱為索引下推。那么索引下推是這個什么東東呢？其實從“索引條件推送”這個名字就可以表明，這個特性是可以在索引中的字段進(jìn)行條件判斷，然后過濾不滿足條件的記錄，減少回表的次數(shù)。

比如以上圖中的數(shù)據(jù)為準(zhǔn)，sql如下：

select * from person where name like 'A%' and age =19;

那么如果沒有索引下推的情況下，首先會根據(jù)索引查詢出名字以A開頭的所有記錄，然后查詢出ID，然后回表去查詢對應(yīng)的ID記錄，最后再判斷age=19，返回滿足條件的語句。因為滿足A開頭的記錄有2條，所以這種情況下，會回表2次。

在索引下推情況下，InnoDB會在索引內(nèi)部直接判斷age=19是否滿足條件，過濾掉不滿足條件的記錄，所以只返回了一條，也就是只需要回表一次。從而提高了性能。

3.5 索引的優(yōu)點(diǎn)與缺點(diǎn)

說了這么多關(guān)于索引的內(nèi)容，我們來談?wù)勊饕膬?yōu)缺點(diǎn)。

優(yōu)點(diǎn)：

減少服務(wù)器需要掃描的數(shù)據(jù)量
索引可以幫助服務(wù)器避免排序和臨時表
索引可以將隨機(jī)IO變?yōu)轫樞騃O

缺點(diǎn)

索引會占用額外的存儲空間
索引的維護(hù)需要一定的成本，插入數(shù)據(jù)后需要保證原來的索引有序，所以也會影響一定的數(shù)據(jù)庫性能。

四、總結(jié)

這篇博文我主要說了，索引的定義，索引的分類，索引按照不同的角度可以分為常見的哪幾種。然后我重點(diǎn)說了在InnoDB下索引的索引的數(shù)據(jù)結(jié)構(gòu)。?主鍵索引和非主鍵索引的區(qū)別就是查詢主鍵索引可以直接返回數(shù)據(jù)，非主鍵索引需要先查詢出主鍵ID，然后再查詢出數(shù)據(jù)，這個過程就叫做回表。我們可以通過覆蓋索引減少回表的次數(shù)，從而達(dá)到提高性能的效果。在mysql5.6以后，InnoDB可以支持索引下推，在使用聯(lián)合索引的時候，如果可以在索引判斷條件，那么就在索引中過濾不滿足條件的行，從而減少回表次數(shù)。

五、參考

《高性能MySql》第3版
《MySql45講》專欄

總結(jié)

以上是生活随笔為你收集整理的聊聊 MySql 索引那些事儿的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇：一条SQL语句在MySQL中是如何执行的
下一篇：知乎高赞回答：裁员、降薪、996...这