演算法一:高速排序演算法
高速排序是由東尼·霍爾所發展的一種排序演算法。在平均狀況下,排序 n 個專案要Ο(n log n)次比較。在最壞狀況下則須要Ο(n2) 次比較,但這樣的狀況並不常見。其實,高速排序通常明顯比其它Ο(n log n) 演算法更快,由於它的內部迴圈(inner loop)能夠在大部分的架構上很有效率地被實現出來。
高速排序使用分治法(Divide and conquer)策略來把一個序列(list)分為兩個子序列(sub-lists)。
演算法步驟:
1 從數列中挑出一個元素,稱為 “基準”(pivot)。
2 又一次排序數列,全部元素比基準值小的擺放在基準前面。全部元素比基準值大的擺在基準的後面(相同的數能夠到任一邊)。在這個分割槽退出之後,該基準就處於數列的中間位置。
這個稱為分割槽(partition)操作。
3 遞迴地(recursive)把小於基準值元素的子數列和大於基準值元素的子數列排序。
遞迴的最底部情形,是數列的大小是零或一,也就是永遠都已經被排序好了。雖然一直遞迴下去,可是這個演算法總會退出。由於在每次的迭代(iteration)中。它至少會把一個元素擺到它最後的位置去。
演算法二:堆排序演算法
堆排序(Heapsort)是指利用堆這樣的資料結構所設計的一種排序演算法。
堆積是一個近似全然二叉樹的結構,並同一時候滿足堆積的性質:即子結點的鍵值或索引總是小於(或者大於)它的父節點。
堆排序的平均時間複雜度為Ο(nlogn) 。
1. 建立一個堆H[0..n-1]
2. 把堆首(最大值)和堆尾互換
3. 把堆的尺寸縮小1,並呼叫 shift_down (0),目的是把新的陣列頂端資料調整到相應位置
4. 反覆步驟2。直到堆的尺寸為1
演算法三:歸併排序
歸併排序(Merge sort。臺灣譯作:合併排序)是建立在歸併操作上的一種有效的排序演算法。該演算法是採用分治法(Divide and Conquer)的一個很典型的應用。
1. 申請空間,使其大小為兩個已經排序序列之和。該空間用來存放合併後的序列
2. 設定兩個指標,最初位置分別為兩個已經排序序列的起始位置
3. 比較兩個指標所指向的元素,選擇相對小的元素放入到合併空間。並移動指標到下一位置
4. 反覆步驟 3 直到某一指標達到序列尾
5. 將還有一序列剩下的全部元素直接複製到合併序列尾
演算法四:二分查詢演算法
二分查詢演算法是一種在有序陣列中查詢某一特定元素的搜尋演算法。
搜素過程從陣列的中間元素開始,假設中間元素正好是要查詢的元素,則搜素過程結束;假設某一特定元素大於或者小於中間元素。則在陣列大於或小於中間元素的那一半中查詢,並且跟開始一樣從中間元素開始比較。
假設在某一步驟陣列為空,則代表找不到。這樣的搜尋演算法每一次比較都使搜尋範圍縮小一半。折半搜尋每次把搜尋區域降低一半。時間複雜度為Ο(logn) 。
演算法五:BFPRT(線性查詢演算法)
BFPRT 演算法解決的問題十分經典,即從某n個元素的序列中選出第k大(第k小)的元素。透過巧妙的分析,BFPRT 能夠保證在最壞情況下仍為線性時間複雜度。該演算法的思想與高速排序思想類似,當然,為使得演算法在最壞情況下,依舊能達到o(n)的時間複雜度,五位演算法作者做了精妙的處理。
1. 將n個元素每 5 個一組,分成n/5(上界)組。
2. 取出每一組的中位數,隨意排序方法,比方插入排序。
3. 遞迴的呼叫 selection 演算法查詢上一步中全部中位數的中位數。設為x,偶數箇中位數的情況下設定為選取中間小的一個。
4. 用x來切割陣列,設小於等於x的個數為k,大於x的個數即為n-k。
5. 若i==k,返回x。若i<k,在小於x的元素中遞迴查詢第i小的元素。若i>k。在大於x的元素中遞迴查詢第i-k 小的元素。
終止條件:n=1 時。返回的即是i小元素。
演算法六:DFS(深度優先搜尋)
深度優先搜尋演算法(Depth-First-Search),是搜尋演算法的一種。它沿著樹的深度遍歷樹的節點,儘可能深的搜尋樹的分支。當節點v的全部邊都己被探尋過。搜尋將回溯到發現節點v的那條邊的起始節點。這一過程一直進行到已發現從源節點可達的全部節點為止。
假設還存在未被發現的節點,則選擇當中一個作為源節點並反覆以上過程,整個程序反覆進行直到全部節點都被訪問為止。
DFS 屬於盲目搜尋。
深度優先搜尋是圖論中的經典演算法,利用深度優先搜尋演算法能夠產生目標圖的相應拓撲排序表,利用拓撲排序表能夠方便的解決很多相關的圖論問題。如最大路徑問題等等。一般用堆資料結構來輔助實現 DFS 演算法。
深度優先遍歷圖演算法步驟:
1. 訪問頂點v;
2. 依次從v的未被訪問的鄰接點出發。對圖進行深度優先遍歷;直至圖中和v有路徑相通的頂點都被訪問。
3. 若此時圖中尚有頂點未被訪問。則從一個未被訪問的頂點出發,又一次進行深度優先遍歷,直到圖中全部頂點均被訪問過為止。
上述描寫敘述可能比較抽象,舉個例項:
DFS 在訪問圖中某一起始頂點 v 後,由 v 出發。訪問它的任一鄰接頂點 w1。再從 w1 出發。訪問與 w1 鄰 接但還沒有訪問過的頂點 w2;然後再從 w2 出發,進行類似的訪問,… 如此進行下去,直至到達全部的鄰接頂點都被訪問過的頂點 u 為止。
接著,退回一步,退到前一次剛訪問過的頂點,看是否還有其它沒有被訪問的鄰接頂點。假設有,則訪問此頂點。之後再從此頂點出發。進行與前述類似的訪問;假設沒有。就再退回一步進行搜尋。反覆上述過程,直到連通圖中全部頂點都被訪問過為止。
演算法七:BFS (廣度優先搜尋)
廣度優先搜尋演算法(Breadth-First-Search),是一種圖形搜尋演算法。簡單的說。BFS 是從根節點開始,沿著樹(圖)的寬度遍歷樹(圖)的節點。假設全部節點均被訪問,則演算法中止。BFS 相同屬於盲目搜尋。一般用佇列資料結構來輔助實現 BFS 演算法。
1. 首先將根節點放入佇列中。
2. 從佇列中取出第一個節點。並檢驗它是否為目標。
假設找到目標。則結束搜尋並回傳結果。
否則將它全部尚未檢驗過的直接子節點增加佇列中。
3. 若佇列為空,表示整張圖都檢查過了——亦即圖中沒有欲搜尋的目標。結束搜尋並回傳“找不到目標”。
4. 反覆步驟2。
演算法八:Dijkstra演算法
戴克斯特拉演算法(Dijkstra’s algorithm)是由荷蘭計算機科學家艾茲赫爾·戴克斯特拉提出。迪科斯徹演算法使用了廣度優先搜尋解決非負權有向圖的單源最短路徑問題,演算法終於得到一個最短路徑樹。該演算法經常使用於路由演算法或者作為其它圖演算法的一個子模組。
我們以 V 表示 G 中全部頂點的集合。每個圖中的邊,都是兩個頂點所形成的有序元素對。
(u, v) 表示從頂點 u 到 v 有路徑相連。我們以 E 表示G中全部邊的集合。而邊的權重則由權重函式 w: E → [0, ∞] 定義。因此,w(u, v) 就是從頂點 u 到頂點 v 的非負權重(weight)。邊的權重能夠想像成兩個頂點之間的距離。
任兩點間路徑的權重,就是該路徑上全部邊的權重總和。
已知有 V 中有頂點 s 及 t,Dijkstra 演算法能夠找到 s 到 t的最低權重路徑(比如,最短路徑)。這個演算法也能夠在一個圖中,找到從一個頂點 s 到不論什麼其它頂點的最短路徑。對於不含負權的有向圖。Dijkstra 演算法是眼下已知的最快的單源最短路徑演算法。
1. 初始時令 S={V0},T={其餘頂點},T中頂點相應的距離值
若存在<V0,Vi>,d(V0,Vi)為<V0,Vi>弧上的權值
若不存在<V0,Vi>。d(V0,Vi)為∞
2. 從T中選取一個其距離值為最小的頂點W且不在S中,增加S
3. 對其餘T中頂點的距離值進行改動:若加進W作中間頂點,從 V0 到 Vi 的距離值縮短。則改動此距離值
反覆上述步驟2、3,直到S中包括全部頂點,即W=Vi 為止
演算法九:動態規劃演算法
動態規劃(Dynamic programming)是一種在數學、計算機科學和經濟學中使用的。透過把原問題分解為相對簡單的子問題的方式求解複雜問題的方法。
動態規劃經常適用於有重疊子問題和最優子結構性質的問題,動態規劃方法所耗時間往往遠少於樸素解法。
動態規劃背後的基本思想很easy。大致上。若要解一個給定問題,我們須要解其不同部分(即子問題),再合併子問題的解以得出原問題的解。 通常很多子問題很類似。為此動態規劃法試圖僅僅解決每個子問題一次,從而降低計算量: 一旦某個給定子問題的解已經算出,則將其記憶化儲存。以便下次須要同一個子問題解之時直接查表。 這樣的做法在反覆子問題的數目關於輸入的規模呈指數增長時特別實用。
關於動態規劃最經典的問題當屬揹包問題。
1. 最優子結構性質。假設問題的最優解所包括的子問題的解也是最優的。我們就稱該問題具有最優子結構性質(即滿足最最佳化原理)。最優子結構性質為動態規劃演算法解決這個問題提供了重要線索。
2. 子問題重疊性質。子問題重疊性質是指在用遞迴演算法自頂向下對問題進行求解時。每次產生的子問題並不總是新問題,有些子問題會被反覆計算多次。
動態規劃演算法正是利用了這樣的子問題的重疊性質,對每個子問題僅僅計算一次,然後將其計算結果儲存在一個表格中,當再次須要計算已經計算過的子問題時,僅僅是在表格中簡單地檢視一下結果,從而獲得較高的效率。
演算法十:樸素貝葉斯分類演算法
樸素貝葉斯分類演算法是一種基於貝葉斯定理的簡單機率分類演算法。貝葉斯分類的基礎是機率推理,就是在各種條件的存在不確定,僅知其出現機率的情況下,怎樣完畢推理和決策任務。
機率推理是與確定性推理相相應的。而樸素貝葉斯分類器是基於獨立假設的,即假設樣本每個特徵與其它特徵都不相關。
樸素貝葉斯分類器依靠精確的自然機率模型,在有監督學習的樣本集中能獲取得很好的分類效果。在很多實際應用中,樸素貝葉斯模型引數預計使用最大似然預計方法。換言之樸素貝葉斯模型能工作並沒實用到貝葉斯機率或者不論什麼貝葉斯模型。
雖然是帶著這些樸素思想和過於簡單化的假設,但樸素貝葉斯分類器在很多複雜的現實情形中仍能夠取得相當好的效果。
演算法一:高速排序演算法
高速排序是由東尼·霍爾所發展的一種排序演算法。在平均狀況下,排序 n 個專案要Ο(n log n)次比較。在最壞狀況下則須要Ο(n2) 次比較,但這樣的狀況並不常見。其實,高速排序通常明顯比其它Ο(n log n) 演算法更快,由於它的內部迴圈(inner loop)能夠在大部分的架構上很有效率地被實現出來。
高速排序使用分治法(Divide and conquer)策略來把一個序列(list)分為兩個子序列(sub-lists)。
演算法步驟:
1 從數列中挑出一個元素,稱為 “基準”(pivot)。
2 又一次排序數列,全部元素比基準值小的擺放在基準前面。全部元素比基準值大的擺在基準的後面(相同的數能夠到任一邊)。在這個分割槽退出之後,該基準就處於數列的中間位置。
這個稱為分割槽(partition)操作。
3 遞迴地(recursive)把小於基準值元素的子數列和大於基準值元素的子數列排序。
遞迴的最底部情形,是數列的大小是零或一,也就是永遠都已經被排序好了。雖然一直遞迴下去,可是這個演算法總會退出。由於在每次的迭代(iteration)中。它至少會把一個元素擺到它最後的位置去。
演算法二:堆排序演算法
堆排序(Heapsort)是指利用堆這樣的資料結構所設計的一種排序演算法。
堆積是一個近似全然二叉樹的結構,並同一時候滿足堆積的性質:即子結點的鍵值或索引總是小於(或者大於)它的父節點。
堆排序的平均時間複雜度為Ο(nlogn) 。
演算法步驟:
1. 建立一個堆H[0..n-1]
2. 把堆首(最大值)和堆尾互換
3. 把堆的尺寸縮小1,並呼叫 shift_down (0),目的是把新的陣列頂端資料調整到相應位置
4. 反覆步驟2。直到堆的尺寸為1
演算法三:歸併排序
歸併排序(Merge sort。臺灣譯作:合併排序)是建立在歸併操作上的一種有效的排序演算法。該演算法是採用分治法(Divide and Conquer)的一個很典型的應用。
演算法步驟:
1. 申請空間,使其大小為兩個已經排序序列之和。該空間用來存放合併後的序列
2. 設定兩個指標,最初位置分別為兩個已經排序序列的起始位置
3. 比較兩個指標所指向的元素,選擇相對小的元素放入到合併空間。並移動指標到下一位置
4. 反覆步驟 3 直到某一指標達到序列尾
5. 將還有一序列剩下的全部元素直接複製到合併序列尾
演算法四:二分查詢演算法
二分查詢演算法是一種在有序陣列中查詢某一特定元素的搜尋演算法。
搜素過程從陣列的中間元素開始,假設中間元素正好是要查詢的元素,則搜素過程結束;假設某一特定元素大於或者小於中間元素。則在陣列大於或小於中間元素的那一半中查詢,並且跟開始一樣從中間元素開始比較。
假設在某一步驟陣列為空,則代表找不到。這樣的搜尋演算法每一次比較都使搜尋範圍縮小一半。折半搜尋每次把搜尋區域降低一半。時間複雜度為Ο(logn) 。
演算法五:BFPRT(線性查詢演算法)
BFPRT 演算法解決的問題十分經典,即從某n個元素的序列中選出第k大(第k小)的元素。透過巧妙的分析,BFPRT 能夠保證在最壞情況下仍為線性時間複雜度。該演算法的思想與高速排序思想類似,當然,為使得演算法在最壞情況下,依舊能達到o(n)的時間複雜度,五位演算法作者做了精妙的處理。
演算法步驟:
1. 將n個元素每 5 個一組,分成n/5(上界)組。
2. 取出每一組的中位數,隨意排序方法,比方插入排序。
3. 遞迴的呼叫 selection 演算法查詢上一步中全部中位數的中位數。設為x,偶數箇中位數的情況下設定為選取中間小的一個。
4. 用x來切割陣列,設小於等於x的個數為k,大於x的個數即為n-k。
5. 若i==k,返回x。若i<k,在小於x的元素中遞迴查詢第i小的元素。若i>k。在大於x的元素中遞迴查詢第i-k 小的元素。
終止條件:n=1 時。返回的即是i小元素。
演算法六:DFS(深度優先搜尋)
深度優先搜尋演算法(Depth-First-Search),是搜尋演算法的一種。它沿著樹的深度遍歷樹的節點,儘可能深的搜尋樹的分支。當節點v的全部邊都己被探尋過。搜尋將回溯到發現節點v的那條邊的起始節點。這一過程一直進行到已發現從源節點可達的全部節點為止。
假設還存在未被發現的節點,則選擇當中一個作為源節點並反覆以上過程,整個程序反覆進行直到全部節點都被訪問為止。
DFS 屬於盲目搜尋。
深度優先搜尋是圖論中的經典演算法,利用深度優先搜尋演算法能夠產生目標圖的相應拓撲排序表,利用拓撲排序表能夠方便的解決很多相關的圖論問題。如最大路徑問題等等。一般用堆資料結構來輔助實現 DFS 演算法。
深度優先遍歷圖演算法步驟:
1. 訪問頂點v;
2. 依次從v的未被訪問的鄰接點出發。對圖進行深度優先遍歷;直至圖中和v有路徑相通的頂點都被訪問。
3. 若此時圖中尚有頂點未被訪問。則從一個未被訪問的頂點出發,又一次進行深度優先遍歷,直到圖中全部頂點均被訪問過為止。
上述描寫敘述可能比較抽象,舉個例項:
DFS 在訪問圖中某一起始頂點 v 後,由 v 出發。訪問它的任一鄰接頂點 w1。再從 w1 出發。訪問與 w1 鄰 接但還沒有訪問過的頂點 w2;然後再從 w2 出發,進行類似的訪問,… 如此進行下去,直至到達全部的鄰接頂點都被訪問過的頂點 u 為止。
接著,退回一步,退到前一次剛訪問過的頂點,看是否還有其它沒有被訪問的鄰接頂點。假設有,則訪問此頂點。之後再從此頂點出發。進行與前述類似的訪問;假設沒有。就再退回一步進行搜尋。反覆上述過程,直到連通圖中全部頂點都被訪問過為止。
演算法七:BFS (廣度優先搜尋)
廣度優先搜尋演算法(Breadth-First-Search),是一種圖形搜尋演算法。簡單的說。BFS 是從根節點開始,沿著樹(圖)的寬度遍歷樹(圖)的節點。假設全部節點均被訪問,則演算法中止。BFS 相同屬於盲目搜尋。一般用佇列資料結構來輔助實現 BFS 演算法。
演算法步驟:
1. 首先將根節點放入佇列中。
2. 從佇列中取出第一個節點。並檢驗它是否為目標。
假設找到目標。則結束搜尋並回傳結果。
否則將它全部尚未檢驗過的直接子節點增加佇列中。
3. 若佇列為空,表示整張圖都檢查過了——亦即圖中沒有欲搜尋的目標。結束搜尋並回傳“找不到目標”。
4. 反覆步驟2。
演算法八:Dijkstra演算法
戴克斯特拉演算法(Dijkstra’s algorithm)是由荷蘭計算機科學家艾茲赫爾·戴克斯特拉提出。迪科斯徹演算法使用了廣度優先搜尋解決非負權有向圖的單源最短路徑問題,演算法終於得到一個最短路徑樹。該演算法經常使用於路由演算法或者作為其它圖演算法的一個子模組。
我們以 V 表示 G 中全部頂點的集合。每個圖中的邊,都是兩個頂點所形成的有序元素對。
(u, v) 表示從頂點 u 到 v 有路徑相連。我們以 E 表示G中全部邊的集合。而邊的權重則由權重函式 w: E → [0, ∞] 定義。因此,w(u, v) 就是從頂點 u 到頂點 v 的非負權重(weight)。邊的權重能夠想像成兩個頂點之間的距離。
任兩點間路徑的權重,就是該路徑上全部邊的權重總和。
已知有 V 中有頂點 s 及 t,Dijkstra 演算法能夠找到 s 到 t的最低權重路徑(比如,最短路徑)。這個演算法也能夠在一個圖中,找到從一個頂點 s 到不論什麼其它頂點的最短路徑。對於不含負權的有向圖。Dijkstra 演算法是眼下已知的最快的單源最短路徑演算法。
演算法步驟:
1. 初始時令 S={V0},T={其餘頂點},T中頂點相應的距離值
若存在<V0,Vi>,d(V0,Vi)為<V0,Vi>弧上的權值
若不存在<V0,Vi>。d(V0,Vi)為∞
2. 從T中選取一個其距離值為最小的頂點W且不在S中,增加S
3. 對其餘T中頂點的距離值進行改動:若加進W作中間頂點,從 V0 到 Vi 的距離值縮短。則改動此距離值
反覆上述步驟2、3,直到S中包括全部頂點,即W=Vi 為止
演算法九:動態規劃演算法
動態規劃(Dynamic programming)是一種在數學、計算機科學和經濟學中使用的。透過把原問題分解為相對簡單的子問題的方式求解複雜問題的方法。
動態規劃經常適用於有重疊子問題和最優子結構性質的問題,動態規劃方法所耗時間往往遠少於樸素解法。
動態規劃背後的基本思想很easy。大致上。若要解一個給定問題,我們須要解其不同部分(即子問題),再合併子問題的解以得出原問題的解。 通常很多子問題很類似。為此動態規劃法試圖僅僅解決每個子問題一次,從而降低計算量: 一旦某個給定子問題的解已經算出,則將其記憶化儲存。以便下次須要同一個子問題解之時直接查表。 這樣的做法在反覆子問題的數目關於輸入的規模呈指數增長時特別實用。
關於動態規劃最經典的問題當屬揹包問題。
演算法步驟:
1. 最優子結構性質。假設問題的最優解所包括的子問題的解也是最優的。我們就稱該問題具有最優子結構性質(即滿足最最佳化原理)。最優子結構性質為動態規劃演算法解決這個問題提供了重要線索。
2. 子問題重疊性質。子問題重疊性質是指在用遞迴演算法自頂向下對問題進行求解時。每次產生的子問題並不總是新問題,有些子問題會被反覆計算多次。
動態規劃演算法正是利用了這樣的子問題的重疊性質,對每個子問題僅僅計算一次,然後將其計算結果儲存在一個表格中,當再次須要計算已經計算過的子問題時,僅僅是在表格中簡單地檢視一下結果,從而獲得較高的效率。
演算法十:樸素貝葉斯分類演算法
樸素貝葉斯分類演算法是一種基於貝葉斯定理的簡單機率分類演算法。貝葉斯分類的基礎是機率推理,就是在各種條件的存在不確定,僅知其出現機率的情況下,怎樣完畢推理和決策任務。
機率推理是與確定性推理相相應的。而樸素貝葉斯分類器是基於獨立假設的,即假設樣本每個特徵與其它特徵都不相關。
樸素貝葉斯分類器依靠精確的自然機率模型,在有監督學習的樣本集中能獲取得很好的分類效果。在很多實際應用中,樸素貝葉斯模型引數預計使用最大似然預計方法。換言之樸素貝葉斯模型能工作並沒實用到貝葉斯機率或者不論什麼貝葉斯模型。
雖然是帶著這些樸素思想和過於簡單化的假設,但樸素貝葉斯分類器在很多複雜的現實情形中仍能夠取得相當好的效果。