首頁>Club>
8
回覆列表
  • 1 # 科學史話

    最左字首匹配原則

    在mysql建立聯合索引時會遵循最左字首匹配的原則,即最左優先,在檢索資料時從聯合索引的最左邊開始匹配,

    示例:

    對列Gid、列Cid和列Sid建一個聯合索引

    聯合索引 uni_Gid_Cid_SId 實際建立了(Gid)、(Gid,Cid)、(Gid,Cid,SId)三個索引。

    插入模擬資料

    查詢例項:

    上面這個查詢語句執行時會依照最左字首匹配原則,檢索時會使用索引(Gid,Cid)進行資料匹配。

    注意

    索引的欄位可以是任意順序的,如:

    這兩個查詢語句都會用到索引(Gid,Cid),mysql建立聯合索引的規則是首先會對聯合合索引的最左邊的,也就是第一個欄位Gid的資料進行排序,在第一個欄位的排序基礎上,然後再對後面第二個欄位Cid進行排序。其實就相當於實現了類似 order by Gid Cid這樣一種排序規則。

    有人會疑惑第二個查詢語句不符合最左字首匹配:首先可以肯定是兩個查詢語句都保函索引(Gid,Cid)中的Gid、Cid兩個欄位,只是順序不一樣,查詢條件一樣,最後所查詢的結果肯定是一樣的。既然結果是一樣的,到底以何種順序的查詢方式最好呢?此時我們可以藉助mysql查詢最佳化器explain,explain會糾正sql語句該以什麼樣的順序執行效率最高,最後才生成真正的執行計劃。

    那麼問題產生了?既然結果是一樣的,到底以何種順序的查詢方式最好呢?

    所以,而此時那就是我們的mysql查詢最佳化器該登場了,sql語句中欄位的順序不需要和聯合索引中定義的欄位順序一致,查詢最佳化器會自己調整順序,mysql查詢最佳化器會判斷糾正這條sql語句該以什麼樣的順序執行效率最高,最後才生成真正的執行計劃。所以,當然是我們能儘量的利用到索引時的查詢順序效率最高咯,所以mysql查詢最佳化器會最終以這種順序進行查詢執行。

    為什麼要使用聯合索引

    減少開銷。建一個聯合索引(Gid,Cid,SId),實際相當於建了(Gid)、(Gid,Cid)、(Gid,Cid,SId)三個索引。每多一個索引,都會增加寫操作的開銷和磁碟空間的開銷。對於大量資料的表,使用聯合索引會大大的減少開銷!

    覆蓋索引。對聯合索引(Gid,Cid,SId),如果有如下的sql: select Gid,Cid,SId from student where Gid=1 and Cid=2。那麼MySQL可以直接透過遍歷索引取得資料,而無需回表,這減少了很多的隨機io操作。減少io操作,特別的隨機io其實是dba主要的最佳化策略。所以,在真正的實際應用中,覆蓋索引是主要的提升效能的最佳化手段之一。

    效率高。索引列越多,透過索引篩選出的資料越少。有1000W條資料的表,有如下sql:select from table where Gid=1 and Cid=2 and SId=3,假設假設每個條件可以篩選出10%的資料,如果只有單值索引,那麼透過該索引能篩選出1000W10%=100w條資料,然後再回表從100w條資料中找到符合Gid=2 and Cid= 3的資料,然後再排序,再分頁;如果是聯合索引,透過索引篩選出1000w10% 10% *10%=1w,效率提升可想而知!

    缺點。聯合索引越多,索引列越多,則建立的索引越多,索引都是儲存在磁盤裡的,透過索引演算法(Btree代表索引演算法使用二叉樹的形式來做索引的)來查詢資料,的確可以極大的提高查詢效率,但是與此同時增刪改的同時,需要更新索引,同樣是需要花時間的,並且索引所佔的磁碟空間也不小。

    建議。單表儘可能不要超過一個聯合索引,單個聯合索引不超過3個欄位。

    引申

    對於聯合索引(Gid,Cid,SId),查詢語句SELECT * FROM student WHERE Cid = 465176354 ;是否能夠觸發索引?大多數人都會說NO,實際上卻是YES。

    原因:

    觀察上述兩個explain結果中的type欄位。查詢中分別是:

    type: indextype: ref

    index:這種型別表示mysql會對整個該索引進行掃描。要想用到這種型別的索引,對這個索引並無特別要求,只要是索引,或者某個聯合索引的一部分,mysql都可能會採用index型別的方式掃描。但是呢,缺點是效率不高,mysql會從索引中的第一個資料一個個的查詢到最後一個數據,直到找到符合判斷條件的某個索引。所以,上述語句會觸發索引。

    ref:這種型別表示mysql會根據特定的演算法快速查詢到某個符合條件的索引,而不是會對索引中每一個數據都進行一一的掃描判斷,也就是所謂你平常理解的使用索引查詢會更快的取出資料。而要想實現這種查詢,索引卻是有要求的,要實現這種能快速查詢的演算法,索引就要滿足特定的資料結構。簡單說,也就是索引欄位的資料必須是有序的,才能實現這種型別的查詢,才能利用到索引。

  • 中秋節和大豐收的關聯?
  • 寫一篇一位女同班同學的作文?