回覆列表
-
1 # 愛可生雲資料庫
-
2 # 小鹹哥
大致原理如下
需要獲取鎖的客戶端向伺服器傳送建立鎖節點請求,比如在/lock空間節點下建立,伺服器依據先後順序(同步方式保證),依次建立/node-0000000000,/node-0000000001 等節點,之後客戶端獲取/lock下節點列表,判斷自己建立的節點是不是最小的,是則獲取到鎖,使用完成後刪除自己的鎖節點,需要獲取鎖的其他客戶端再次獲取鎖節點資訊(沒有建立節點的客戶端傳送建立請求,已經建立的則獲取),判斷是否自己最小,從而獲取鎖。
Apache Zookeeper是我最近遇到的最酷的技術,我是在研究Solr Cloud功能的時候發現的。Solr的分散式計算讓我印象深刻。你只要開啟一個新的例項就能自動在Solr Cloud中找到。它會將自己分派到某個分片中,並確定出自己是一個Leader(源)還是一個副本。不一會兒,你就可以在你的那些伺服器上查詢到了。即便某些伺服器宕機了也可以繼續工作。非常動態、聰明、酷。
將執行多個應用程式作為一個邏輯程式並不是什麼新玩意。事實上,我在幾年前就已寫過類似的軟體。這種架構比較讓人迷惑,使用起來也費勁。為此Apache Zookeeper提供了一套工具用於管理這種軟體。
為什麼叫Zoo?“因為要協調的分散式系統是一個動物園”。
在本篇文章中,我將說明如何使用PHP安裝和整合Apache ZooKeeper。我們將透過service來協調各個獨立的PHP指令碼,並讓它們同意某個成為Leader(所以稱作Leader選舉)。當Leader退出(或崩潰)時,worker可檢測到並再選出新的leader。
ZooKeeper是一箇中性化的Service,用於管理配置資訊、命名、提供分散式同步,還能組合Service。所有這些種類的Service都會在分散式應用程式中使用到。每次編寫這些Service都會涉及大量的修bug和競爭情況。正因為這種編寫這些Service有一定難度,所以通常都會忽視它們,這就使得在應用程式有變化時變得難以管理應用程式。即使處理得當,實現這些服務的不同方法也會使得部署應用程式變得難以管理。
雖然ZooKeeper是一個Java應用程式,但C也可以使用。這裡就有個PHP的擴充套件,由Andrei Zmievski在2009建立並維護。你可以從PECL中下載,或從GitHub中直接獲取PHP-ZooKeeper。
$ tar zxfv zookeeper-3.4.5.tar.gz $ cd zookeeper-3.4.5/src/c $ ./configure --prefix=/usr/ $ make $ sudo make install
這樣就會安裝ZooKeeper的庫和標頭檔案。現在準備編譯PHP擴充套件。
$ cd$ git clone https://github.com/andreiz/php-zookeeper.git $ cd php-zookeeper $ phpize $ ./configure $ make $ sudo make install
將“zookeeper.so”新增到PHP配置中。
$ vim /etc/php5/cli/conf.d/20-zookeeper.ini
因為我不需要執行在web服務環境下,所以這裡我只編輯了CLI的配置。將下面的行復制到ini檔案中。
extension=zookeeper.so
使用如下命令來確定擴充套件是否已起作用。
$ php -m | grep zookeeper zookeeper
現在是時候執行ZooKeeper了。目前唯一還沒有做的是配置。建立一個用於存放所有service資料的目錄。
$ mkdir /home/you-account/zoo $ cd$ cd zookeeper-3.4.5/ $ cp conf/zoo_sample.cfg conf/zoo.cfg $ vim conf/zoo.cfg
找到名為“dataDir”的屬性,將其指向“/home/you-account/zoo”目錄。
$ bin/zkServer.sh start $ bin/zkCli.sh -server 127.0.0.1:2181[zk: 127.0.0.1:2181(CONNECTED) 14] create /test 1 Created /test[zk: 127.0.0.1:2181(CONNECTED) 19] ls /[test, zookeeper]
此時,你已成功連到了ZooKeeper,並建立了一個名為“/test”的znode(稍後我們會用到)。ZooKeeper以樹形結構儲存資料。這很類似於檔案系統,但“資料夾”(譯者注:這裡指非最底層的節點)又和檔案很像。znode是ZooKeeper儲存的實體。Node(節點)的說法很容易被混淆,所以為了避免混淆這裡使用了znode。
因為我們稍後還會使用,所以這裡我們讓客戶端保持連線狀態。開啟一個新視窗,並建立一個zookeeperdemo1.php檔案。
<?php class ZookeeperDemo extends Zookeeper { public function watcher( $i, $type, $key ) { echo "Insider Watcher\n"; // Watcher gets consumed so we need to set a new one $this->get( "/test", array($this, "watcher" ) ); } } $zoo = new ZookeeperDemo("127.0.0.1:2181");$zoo->get( "/test", array($zoo, "watcher" ) ); while( true ) { echo "."; sleep(2);}
現在執行該指令碼。
$ php zookeeperdemo1.php
此處應該會每隔2秒產生一個點。現在切換到ZooKeeper客戶端,並更新“/test”值。
[zk: 127.0.0.1:2181(CONNECTED) 20] set /test foo
這樣就會靜默觸發PHP指令碼中的“Insider Watcher”訊息。怎麼會這樣的?
ZooKeeper提供了可以繫結在znode的監視器。如果監視器發現znode發生變化,該service會立即通知所有相關的客戶端。這就是PHP指令碼如何知道變化的。Zookeeper::get方法的第二個引數是回撥函式。當觸發事件時,監視器會被消費掉,所以我們需要在回撥函式中再次設定監視器。
現在你可以準備建立分散式應用程式了。其中的挑戰是讓這些獨立的程式決定哪個(是leader)協調它們的工作,以及哪些(是worker)需要執行。這個處理過程叫做leader選舉,在ZooKeeper Recipes and Solutions你能看到相關的實現方法。
這裡簡單來說就是,每個處理(或伺服器)緊盯著相鄰的那個處理(或伺服器)。如果一個已被監視的處理(也即Leader)退出或者崩潰了,監視程式就會查詢其相鄰(此時最老)的那個處理作為Leader。
在真實的應用程式中,leader會給worker分配任務、監控程序和儲存結果。這裡為了簡化,我跳過了這些部分。
建立一個新的PHP檔案,命名為worker.php。
<?php class Worker extends Zookeeper { const CONTAINER = "/cluster"; protected $acl = array( array( "perms" => Zookeeper::PERM_ALL, "scheme" => "world", "id" => "anyone" ) ); private $isLeader = false; private $znode; public function __construct( $host = "", $watcher_cb = null, $recv_timeout = 10000 ) { parent::__construct( $host, $watcher_cb, $recv_timeout ); } public function register() { if( ! $this->exists( self::CONTAINER ) ) { $this->create( self::CONTAINER, null, $this->acl ); } $this->znode = $this->create( self::CONTAINER . "/w-", null, $this->acl, Zookeeper::EPHEMERAL | Zookeeper::SEQUENCE ); $this->znode = str_replace( self::CONTAINER ."/", "", $this->znode ); printf( "I"m registred as: %s\n", $this->znode ); $watching = $this->watchPrevious(); if( $watching == $this->znode ) { printf( "Nobody here, I"m the leader\n" ); $this->setLeader( true ); } else { printf( "I"m watching %s\n", $watching ); } } public function watchPrevious() { $workers = $this->getChildren( self::CONTAINER ); sort( $workers ); $size = sizeof( $workers ); for( $i = 0 ; $i < $size ; $i++ ) { if( $this->znode == $workers[ $i ] ) { if( $i > 0 ) { $this->get( self::CONTAINER . "/" . $workers[ $i - 1 ], array( $this, "watchNode" ) ); return $workers[ $i - 1 ]; } return $workers[ $i ]; } } throw new Exception( sprintf( "Something went very wrong! I can"t find myself: %s/%s", self::CONTAINER, $this->znode ) ); } public function watchNode( $i, $type, $name ) { $watching = $this->watchPrevious(); if( $watching == $this->znode ) { printf( "I"m the new leader!\n" ); $this->setLeader( true ); } else { printf( "Now I"m watching %s\n", $watching ); } } public function isLeader() { return $this->isLeader; } public function setLeader($flag) { $this->isLeader = $flag; } public function run() { $this->register(); while( true ) { if( $this->isLeader() ) { $this->doLeaderJob(); } else { $this->doWorkerJob(); } sleep( 2 ); } } public function doLeaderJob() { echo "Leading\n"; } public function doWorkerJob() { echo "Working\n"; } } $worker = new Worker( "127.0.0.1:2181" );$worker->run();
開啟至少3個終端,在每個終端中執行以下指令碼:
# term1 $ php worker.php I"m registred as: w-0000000001Nobody here, I"m the leader Leading # term2 $ php worker.php I"m registred as: w-0000000002I"m watching w-0000000001 Working # term3 $ php worker.php I"m registred as: w-0000000003I"m watching w-0000000002 Working
現在模擬Leader崩潰的情形。使用Ctrl+c或其他方法退出第一個指令碼。剛開始不會有任何變化,worker可以繼續工作。後來,ZooKeeper會發現超時,並選舉出新的leader。
雖然這些指令碼很容易理解,但是還是有必要對已使用的Zookeeper標誌作註釋。
$this->znode = $this->create( self::CONTAINER . "/w-", null, $this->acl, Zookeeper::EPHEMERAL | Zookeeper::SEQUENCE );
每個znode都是EPHEMERAL和SEQUENCE的。
EPHEMRAL代表當客戶端失去連線時移除該znode。這就是為何PHP指令碼會知道超時。SEQUENCE代表在每個znode名稱後新增順序標識。我們透過這些唯一標識來標記worker。
在PHP部分還有些問題要注意。該擴充套件目前還是beta版,如果使用不當很容易發生segmentation fault。比如,不能傳入普通函式作為回撥函式,傳入的必須為方法。我希望更多PHP社群的同仁可以看到Apache ZooKeeper的好,同時該擴充套件也會獲得更多的支援。
ZooKeeper是一個強大的軟體,擁有簡潔和簡單的API。由於文件和示例都做的很好,任何人都可以很容易的編寫分散式軟體。讓我們開始吧,這會很有趣的。