前言
跳錶是面試常問的一種資料結構,它在很多中介軟體和語言中得到應用,我們熟知的就有Redis跳錶。並且在面試的很多場景可能會問到,偶爾還會讓你手寫試一試(跳錶可能會讓手寫,紅黑樹是不可能的),這不,給大夥復原一個場景:
但你別慌,遇到蘑菇頭這種面試官也別怕,因為你看到這篇文章了(得意:smirk:),不用像熊貓那樣窘迫。
對於一個數據結構或演算法,人群數量從聽過名稱、瞭解基本原理、清楚執行流程、能夠手寫 呈抖降的趨勢。因為很多資料結構與演算法其核心原理可能簡單,但清楚其執行流程就需要動腦子去思考想明白,但是如果能夠把它寫出來,那就要自己一步步去設計和實現。可能要花很久才能真正寫出來,並且還可能要查閱大量的資料。
而本文在前面進行介紹跳錶,後面部分詳細介紹跳錶的設計和實現,搞懂跳錶,這一篇真的就夠了。
快速瞭解跳錶跳躍表(簡稱跳錶)由美國計算機科學家 William Pugh發明於1989年 。他在論文《Skip lists: a probabilistic alternative to balanced trees》中詳細介紹了跳錶的資料結構和插入刪除等操作。
跳錶(SkipList,全稱跳躍表)是用於有序元素序列快速搜尋查詢的一個數據結構,跳錶是一個隨機化的資料結構,實質就是一種可以進行二分查詢的有序連結串列。跳錶在原有的有序連結串列上面增加了多級索引,透過索引來實現快速查詢。跳錶不僅能提高搜尋效能,同時也可以提高插入和刪除操作的效能。它在效能上和紅黑樹,AVL樹不相上下,但是跳錶的原理非常簡單,實現也比紅黑樹簡單很多。
在這裡你可以看到一些關鍵詞:連結串列( 有序連結串列 )、索引、二分查詢。想必你的腦海中已經有了一個初略的印象,不過你可能還是不清楚這個"會跳的連結串列"有多diao,甚至還可能會產生一點疑慮:跟隨機化有什麼關係?你在下文中很快就能得到答案!
回顧連結串列,我們知道連結串列和順序表(陣列)通常都是相愛相殺,成對出現,各有優劣。而連結串列的優勢就是更高效的插入、刪除。 痛點就是查詢很慢很慢 !每次查詢都是一種O(n)複雜度的操作,連結串列估計自己都氣的想哭了:cry:。
這是一個帶頭結點的連結串列(頭結點相當於一個固定的入口,不儲存有意義的值),每次查詢都需要一個個列舉,相當的慢,我們能不能稍微最佳化一下,讓它稍微跳一跳呢?答案是可以的,我們知道很多演算法和資料結構 以空間換時間 ,我們在上面加一層索引,讓部分節點在上層能夠直接定位到,這樣連結串列的查詢時間近乎減少一半,連結串列自己雖然沒有開心起來,但收起了它想哭的臉。
這樣,在查詢某個節點的時候,首先會從上一層快速定位節點所在的一個範圍,如果找到具體範圍向下然後查詢代價很小,當然在表的結構設計上會增加一個向下的索引(指標)用來查詢確定底層節點。平均查詢速度平均為O(n/2)。但是當節點數量很大的時候,它依舊很慢很慢。我們都知道二分查詢是每次都能折半的去壓縮查詢範圍,要是有序連結串列也能這麼跳起來那就太完美了。沒錯 跳錶就能讓連結串列擁有近乎的接近二分查詢的效率的一種資料結構 ,其原理依然是給上面加若干層索引,最佳化查詢速度。
透過上圖你可以看到,透過這樣的一個數據結構對有序連結串列進行查詢都能近乎二分的效能。就是在上面維護那麼多層的索引,首先在最高階索引上查詢最後一個小於當前查詢元素的位置,然後再跳到次高階索引繼續查詢,直到跳到最底層為止,這時候以及十分接近要查詢的元素的位置了(如果查詢元素存在的話)。由於根據索引可以一次跳過多個元素,所以跳查詢的查詢速度也就變快了。
對於理想的跳錶,每向上一層索引節點數量都是下一層的1/2.那麼如果n個節點增加的節點數量(1/2+1/4+…)<n。並且層數較低,對查詢效果影響不大。但是對於這麼一個結構,你可能會疑惑,這樣完美的結構真的存在嗎?大機率不存在的,因為作為一個連結串列,少不了增刪該查的一些操作。而刪除和插入可能會改變整個結構,所以上面的這些都是理想的結構,在插入的時候是否新增上層索引是個機率問題(1/2的機率),在後面會具體講解。
跳錶的增刪改查上面稍微瞭解了跳錶是個啥,那麼在這裡就給大家談談跳錶的增刪改查過程。在實現本跳錶的過程為了便於操作,我們將跳錶的頭結點(head)的key設為int的最小值(一定滿足左小右大方便比較)。
對於每個節點的設定,設定成SkipNode類,為了防止初學者將next向下還是向右搞混,直接設定right,down兩個指標。
class SkipNode<T>{ int key; T value; SkipNode right,down;//右下個方向的指標 public SkipNode (int key,T value) { this.key=key; this.value=value; }}
跳錶的結構和初始化也很重要,其主要引數和初始化方法為:
public class SkipList <T> { SkipNode headNode;//頭節點,入口 int highLevel;//當前跳錶索引層數 Random random;// 用於投擲硬幣 final int MAX_LEVEL = 32;//最大的層 SkipList(){ random=new Random(); headNode=new SkipNode(Integer.MIN_VALUE,null); highLevel=0; } //其他方法}
查詢操作很多時候連結串列也可能這樣相連僅僅是某個元素或者key作為有序的標準。所以有可能連結串列內部存在一些value。不過修改和查詢其實都是一個操作,找到關鍵數字(key)。並且查詢的流程也很簡單,設定一個臨時節點team=head。當 team不為null 其流程大致如下:
(1) 從team節點出發, 如果當前節點的key與查詢的key相等 ,那麼返回當前節點(如果是修改操作那麼一直向下進行修改值即可)。
(2) 如果key不相等,且 右側為null ,那麼證明只能向下(結果可能出現在下右方向),此時team=team.down
(3) 如果key不相等,且右側不為null,且 右側節點key小於待查詢的key 。那麼說明同級還可向右,此時team=team.right
(4)(否則的情況)如果key不相等,且右側不為null,且 右側節點key大於待查詢的key 。那麼說明如果有結果的話就在這個索引和下個索引之間,此時team=team.down。
最終將按照這個步驟返回正確的節點或者null(說明沒查到)。
例如上圖查詢12節點,首先第一步從head出發發現右側不為空,且7<12,向右;第二步右側為null向下;第三步節點7的右側10<12繼續向右;第四步10右側為null向下;第五步右側12小於等於向右。第六步起始發現相等返回節點結束。
而這塊的程式碼也非常容易:
public SkipNode search(int key) { SkipNode team=headNode; while (team!=null) { if(team.key==key) { return team; } else if(team.right==null)//右側沒有了,只能下降 { team=team.down; } else if(team.right.key>key)//需要下降去尋找 { team=team.down; } else //右側比較小向右 { team=team.right; } } return null;}
刪除操作
刪除操作比起查詢稍微複雜一丟丟,但是比插入簡單。刪除需要改變連結串列結構所以需要處理好節點之間的聯絡。對於刪除操作你需要謹記以下幾點:
根據這兩點分析一下:如果找到當前節點了, 它的前面一個節點怎麼查詢呢 ?這個總不能再遍歷一遍吧!有的使用四個方向的指標(上下左右)用來找到左側節點。是可以的,但是這裡可以 特殊處理一下 ,不直接判斷和操作節點,先找到 待刪除節點的左側節點 。透過這個節點即可完成刪除,然後這個節點直接向下去找下一層待刪除的左側節點。設定一個臨時節點team=head, 當team不為null 具體迴圈流程為:
(1)如果 team右側為null ,那麼team=team.down(之所以敢直接這麼判斷是因為左側有頭結點在左側,不用擔心特殊情況)
例如上圖刪除10節點,首先team=head從team出發,7<10向右(team=team.right後面省略);第二步右側為null只能向下;第三部右側為10在當前層刪除10節點然後向下繼續查詢下一層10節點;第四步8<10向右;第五步右側為10刪除該節點並且team向下。team為null說明刪除完畢退出迴圈。
public void delete(int key)//刪除不需要考慮層數{ SkipNode team=headNode; while (team!=null) { if (team.right == null) {//右側沒有了,說明這一層找到,沒有隻能下降 team=team.down; } else if(team.right.key==key)//找到節點,右側即為待刪除節點 { team.right=team.right.right;//刪除右側節點 team=team.down;//向下繼續查詢刪除 } else if(team.right.key>key)//右側已經不可能了,向下 { team=team.down; } else { //節點還在右側 team=team.right; } }}
插入操作插入操作在實現起來是最麻煩的,需要的考慮的東西最多。回顧查詢,不需要動索引;回顧刪除,每層索引如果有刪除就是了。但是插入不一樣了, 插入需要考慮是否插入索引,插入幾層 等問題。由於需要插入刪除所以我們肯定無法維護一個完全理想的索引結構,因為它耗費的代價太高。但我們使用 隨機化 的方法去判斷是否向上層插入索引。即產生一個[0-1]的隨機數如果小於0.5就向上插入索引,插入完畢後再次使用隨機數判斷是否向上插入索引。運氣好這個值可能是多層索引,運氣不好只插入最底層(這是100%插入的)。但是索引也不能不限制高度,我們一般會設定索引最高值如果大於這個值就不往上繼續新增索引了。
我們一步步剖析該怎麼做,其流程為
(1)首先透過上面查詢的方式,找到 待插入的左節點 。插入的話最底層肯定是需要插入的,所以透過連結串列插入節點(需要考慮是否為末尾節點)
(2)插入完這一層,需要考慮上一層是否插入,首先判斷當前索引層級,如果大於最大值那麼就停止(比如已經到最高索引層了)。否則設定一個隨機數1/2的機率向上插入一層索引(因為理想狀態下的就是每2個向上建一個索引節點)。
(3)繼續(2)的操作,直到機率退出或者索引層數大於最大索引層。
在 具體向上插入 的時候,實質上還有非常重要的細節需要考慮。首先 如何找到上層的待插入節點 ?
這個各個實現方法可能不同,如果有左、上指向的指標那麼可以向左向上找到上層需要插入的節點,但是如果只有右指向和下指向的我們也可以 巧妙的藉助查詢過程中記錄下降的節點 。因為曾經下降的節點倒序就是需要插入的節點,最底層也不例外(因為沒有匹配值會下降為null結束迴圈)。在這裡我使用 棧 這個資料結構進行儲存,當然使用List也可以。下圖就是給了一個插入示意圖。
其次如果該層是目前的 最高層索引 ,需要 繼續向上建立索引 應該怎麼辦?
首先跳錶最初肯定是沒索引的,然後慢慢新增節點才有一層、二層索引,但是如果這個節點新增的索引突破當前最高層,該怎麼辦呢?
這時候 需要注意 了,跳錶的head需要改變了,新建一個ListNode節點作為新的head,將它的down指向老head,將這個head節點加入棧中(也就是這個節點作為下次後面要插入的節點),就比如上面的9節點如果運氣夠好再往上建立一層節點,會是這樣的。
插入上層的時候注意所有節點要新建(複製),除了right的指向down的指向也不能忘記,down指向上一個節點可以用一個臨時節點作為前驅節點。如果層數突破當前最高層,頭head節點(入口)需要改變。
這部分更多的細節在程式碼中註釋解釋了,詳細程式碼為:
public void add(SkipNode node){ int key=node.key; SkipNode findNode=search(key); if(findNode!=null)//如果存在這個key的節點 { findNode.value=node.value; return; } Stack<SkipNode>stack=new Stack<SkipNode>();//儲存向下的節點,這些節點可能在右側插入節點 SkipNode team=headNode;//查詢待插入的節點 找到最底層的哪個節點。 while (team!=null) {//進行查詢操作 if(team.right==null)//右側沒有了,只能下降 { stack.add(team);//將曾經向下的節點記錄一下 team=team.down; } else if(team.right.key>key)//需要下降去尋找 { stack.add(team);//將曾經向下的節點記錄一下 team=team.down; } else //向右 { team=team.right; } } int level=1;//當前層數,從第一層新增(第一層必須新增,先新增再判斷) SkipNode downNode=null;//保持前驅節點(即down的指向,初始為null) while (!stack.isEmpty()) { //在該層插入node team=stack.pop();//丟擲待插入的左側節點 SkipNode nodeTeam=new SkipNode(node.key, node.value);//節點需要重新建立 nodeTeam.down=downNode;//處理豎方向 downNode=nodeTeam;//標記新的節點下次使用 if(team.right==null) {//右側為null 說明插入在末尾 team.right=nodeTeam; } //水平方向處理 else {//右側還有節點,插入在兩者之間 nodeTeam.right=team.right; team.right=nodeTeam; } //考慮是否需要向上 if(level>MAX_LEVEL)//已經到達最高階的節點啦 break; double num=random.nextDouble();//[0-1]隨機數 if(num>0.5)//運氣不好結束 break; level++; if(level>highLevel)//比當前最大高度要高但是依然在允許範圍內 需要改變head節點 { highLevel=level; //需要建立一個新的節點 SkipNode highHeadNode=new SkipNode(Integer.MIN_VALUE, null); highHeadNode.down=headNode; headNode=highHeadNode;//改變head stack.add(headNode);//下次丟擲head } }}
總結對於上面,跳錶完整分析就結束啦,當然,你可能看到不同品種跳錶的實現,還有的用陣列方式表示上下層的關係這樣也可以,但本文只定義right和down兩個方向的連結串列更純正化的講解跳錶。
對於跳錶以及跳錶的同類競爭產品:紅黑樹,為啥Redis的有序集合(zset) 使用跳錶呢?因為跳錶除了查詢插入維護和紅黑樹有著差不多的效率,它是個連結串列,能確定範圍區間,而區間問題在樹上可能就沒那麼方便查詢啦。而JDK中 跳躍表ConcurrentSkipListSet和ConcurrentSkipListMap。 有興趣的也可以查閱一下原始碼。
對於學習,完整的程式碼是非常重要的,這裡我把完整程式碼貼出來,需要的自取。
import java.util.Random;import java.util.Stack;class SkipNode<T>{ int key; T value; SkipNode right,down;//左右上下四個方向的指標 public SkipNode (int key,T value) { this.key=key; this.value=value; }}public class SkipList <T> { SkipNode headNode;//頭節點,入口 int highLevel;//層數 Random random;// 用於投擲硬幣 final int MAX_LEVEL = 32;//最大的層 SkipList(){ random=new Random(); headNode=new SkipNode(Integer.MIN_VALUE,null); highLevel=0; } public SkipNode search(int key) { SkipNode team=headNode; while (team!=null) { if(team.key==key) { return team; } else if(team.right==null)//右側沒有了,只能下降 { team=team.down; } else if(team.right.key>key)//需要下降去尋找 { team=team.down; } else //右側比較小向右 { team=team.right; } } return null; } public void delete(int key)//刪除不需要考慮層數 { SkipNode team=headNode; while (team!=null) { if (team.right == null) {//右側沒有了,說明這一層找到,沒有隻能下降 team=team.down; } else if(team.right.key==key)//找到節點,右側即為待刪除節點 { team.right=team.right.right;//刪除右側節點 team=team.down;//向下繼續查詢刪除 } else if(team.right.key>key)//右側已經不可能了,向下 { team=team.down; } else { //節點還在右側 team=team.right; } } } public void add(SkipNode node) { int key=node.key; SkipNode findNode=search(key); if(findNode!=null)//如果存在這個key的節點 { findNode.value=node.value; return; } Stack<SkipNode>stack=new Stack<SkipNode>();//儲存向下的節點,這些節點可能在右側插入節點 SkipNode team=headNode;//查詢待插入的節點 找到最底層的哪個節點。 while (team!=null) {//進行查詢操作 if(team.right==null)//右側沒有了,只能下降 { stack.add(team);//將曾經向下的節點記錄一下 team=team.down; } else if(team.right.key>key)//需要下降去尋找 { stack.add(team);//將曾經向下的節點記錄一下 team=team.down; } else //向右 { team=team.right; } } int level=1;//當前層數,從第一層新增(第一層必須新增,先新增再判斷) SkipNode downNode=null;//保持前驅節點(即down的指向,初始為null) while (!stack.isEmpty()) { //在該層插入node team=stack.pop();//丟擲待插入的左側節點 SkipNode nodeTeam=new SkipNode(node.key, node.value);//節點需要重新建立 nodeTeam.down=downNode;//處理豎方向 downNode=nodeTeam;//標記新的節點下次使用 if(team.right==null) {//右側為null 說明插入在末尾 team.right=nodeTeam; } //水平方向處理 else {//右側還有節點,插入在兩者之間 nodeTeam.right=team.right; team.right=nodeTeam; } //考慮是否需要向上 if(level>MAX_LEVEL)//已經到達最高階的節點啦 break; double num=random.nextDouble();//[0-1]隨機數 if(num>0.5)//運氣不好結束 break; level++; if(level>highLevel)//比當前最大高度要高但是依然在允許範圍內 需要改變head節點 { highLevel=level; //需要建立一個新的節點 SkipNode highHeadNode=new SkipNode(Integer.MIN_VALUE, null); highHeadNode.down=headNode; headNode=highHeadNode;//改變head stack.add(headNode);//下次丟擲head } } } public void printList() { SkipNode teamNode=headNode; int index=1; SkipNode last=teamNode; while (last.down!=null){ last=last.down; } while (teamNode!=null) { SkipNode enumNode=teamNode.right; SkipNode enumLast=last.right; System.out.printf("%-8s","head->"); while (enumLast!=null&&enumNode!=null) { if(enumLast.key==enumNode.key) { System.out.printf("%-5s",enumLast.key+"->"); enumLast=enumLast.right; enumNode=enumNode.right; } else{ enumLast=enumLast.right; System.out.printf("%-5s",""); } } teamNode=teamNode.down; index++; System.out.println(); } } public static void main(String[] args) { SkipList<Integer>list=new SkipList<Integer>(); for(int i=1;i<20;i++) { list.add(new SkipNode(i,666)); } list.printList(); list.delete(4); list.delete(8); list.printList(); }}
進行測試一下可以發現跳錶還是挺完美的(自誇一下)。