首頁>科技>

​作者 | wei_sir

軟體正在慢條斯理地吞噬世界,開源正在慢條斯理地吞噬軟體業。

軟體正在吞噬世界?是的,對於購物、吃飯、健身、交停車費都需要使用軟體的年代,對於平均每人每天都要花費5到6個小時使用手機軟體的年代,有什麼理由不相信軟體正在吞噬整個世界呢。

開源正在吞噬軟體業?是的,因為在軟體越來越富裕的年代(也即軟體不再稀缺),不開源的軟體,最終是沒法和開源軟體競爭的。舉個簡單例子,如果有人要在很多個檔案加密軟體中選擇一個使用,在功能和價格都差不多的情況下,選擇開源的還是閉源的?當然要選擇開源的,因為誰知道閉源的軟體中,會不會有後門?

開源的成功程度,或者說開源的滲透程度,從中國銀行業的廣泛採用就可以看出來,銀行作為一個在IT方面相當謹慎和保守的行業,在2012年(一個大約的年限)之前對開源基本上不屑一顧,使用的基本上全是商業軟體(這裡是指專有軟體),他們認為商業軟體更專業、品質更高、更可信賴、更有保障,他們中不少人視開源軟體為異類,對其功能、效能、安全性表示擔憂,最重要的是,他們擔心開源軟體出問題後找不到“原廠”解決問題和“承擔責任”。

然而就在2012年以後,銀行業逐漸增加了開源的使用比例,這裡面有很多原因,最重要的一個原因是,在Linux面世20年後,很多開源軟體已經成為比商業軟體更好的存在,以至於諮詢商、整合商、開發商們在為銀行提供解決方案時,所拿出的最佳方案已經是基於開源的方案,銀行(作為甲方)已經無力拒絕。比如,現在當一個銀行要建設其自用的雲平臺時,在諮詢和調研一大圈下來,他幾乎一定會選擇基於openstack的方案,如果想使用容器技術,就幾乎一定會選擇容器編排軟體kubernetes,這時,已經顧不上有沒有“原廠”了(事實上還是有服務商兜底),因為沒有太多更好的選擇了。

銀行雖然還在使用Vmware、Oracle、Websphere、Weblogic,但是KVM、Mysql、Apache、nginx的滲透已經越來越嚴重,多數銀行的Linux主機數量早已超過了Windows伺服器,因為Linux早已成為整個世界的主流的伺服器作業系統,而且還有像Redhat這樣的商業支援,為什麼不使用呢?

據調查,各家銀行的IT部門,在最近5年內,已經不得不正面開源這種“新事物”給他們帶來的“問題”,因為對開源的引入、使用和運維,顯然和以往閉源軟體有明顯不同,他們開始寫出開源軟體使用管理辦法,並指定專門處室來負責管理。

而那些有先見之明的企業(尤其是網際網路企業),早已組建了開源辦公室,早已把自己的整個系統建立在開源軟體之上,並且早已在開源世界投入了大量的資金和人員,毫無疑問,他們也早已從開源中獲得了巨大的收益。

那麼,開源到底依靠什麼,讓自己大獲成功?

本文分析了開源的7大理念,有助於讀者更好理解開源的本質要素,這些理念為“完全自主”、“高度開放”、“自發自治”、“自下而上”、“自由競爭”、“贏在聲譽”以及“社群賦能”。

完全自主

開源之所以能夠大行其道,是因為所有程式設計師都喜歡原始碼。

這就是開源的原生動力。

黑客希望自己有完全自主和完全可控的世界,這和其他人沒有兩樣,但黑客有可能在計算機軟體領域實現這一點。

沒有原始碼就無法掌控世界嗎?是的,如果一個作業系統是閉源的,黑客在使用作業系統時遇到bug而無法修改,遇到需求而不被採納,試圖研究而無從下手,遇到壟斷、高價、霸王條款而無可奈何,哪裡還談得上掌控世界。

再如,黑客寫程式,他希望有一個自己能夠控制或者是能讓自己放心的編輯器,不僅僅需要這個編輯器足夠好用,而且最好不會有後續的麻煩,比如不會有license的麻煩,不會有廠商停止服務的麻煩。黑客希望這個編輯器能盡在掌握之中,遇到bug,自己或者有人能將其修復,一些想要的功能,自己或者有人能將其實現,而且最好是,自己怎麼折騰這個軟體,也不會陷入法律方面的麻煩。

也就是說,黑客喜歡在一個無拘無束的、自由自在的環境下,幹自己喜歡做的事,這是多麼美妙!

黑客想要開源的作業系統,想要開源的編輯器,還想要開源的編譯器、開源的瀏覽器、開源的資料庫、開源的web server、開源的雲環境、開源的虛擬機器軟體、開源的大資料工具、開源的人工智慧軟體。。。總之,如果一切都開源了,這就是黑客感覺最自由和最自主的環境,這就是黑客的理想。

如果很多人都有這樣的需求,而又有人能把它實現,那這件事就必然會發生。

人類社會是很有意思的,一些人的需求,會成為另一些人的動力,當程式設計師們渴望原始碼的時候,自然就會有黑客奉上自己精心打造的原始碼,不管他們是否意識到,在所有的需求滿足背後,都暗藏著豐厚的回報。

當黑客們想要開源作業系統的時候,Tanenbaum帶著MINIX出現了,當人們希望它有更多的特性時,Linus拿出了Linux,當人們需要web server時,NCSA拿出了Apache,作者一開始開源自己的程式碼時,並沒有想太多,可能僅僅就是想說:“兄弟們,看看我寫的這個東西怎麼樣?你們試試用一下?有啥問題,或者有什麼新想法,歡迎給我發郵件!”

時至今日,在企業越來越多主導開源的年代裡,這種原始的動機仍然存在,前段時間開源的TDengine,其主要作者陶建輝在文章中寫道:

“要是有程式設計師仔細研究我們原始碼,看我們是怎麼做到的,我會特別的開心。要是有程式設計師能把我這套方法借鑑過去,把他現在臃腫的系統大幅裁剪,把效能大幅提升,那我更會心花怒放。昨天有人在微信群裡告訴我,說RPC模組寫的高效簡潔,準備採納,真讓我有點得意忘形。”

“兩年多的時間,近二十萬行程式碼,放在了GitHub上。好多朋友關切的問我,開源怎麼贏利?拋開開源的商業模式不提,我想,只要我們開源的程式碼真正創造了價值,有人用,那我和團隊就是最大的贏家。如果30年後,還有人在用TDengine,哪怕只是其中一個模組,其中一個函式,那就是對我們兩年多日夜奮戰的最大肯定,就是給我這個程式設計師的最大回報。”

“如果你發現什麼問題,我只會高興,不睡覺都想盡快去解決它。如果喜歡,更歡迎參與到我們這個專案中來。五年之內,世界上90%以上的資料都將是物聯網採集的資料,如果我們一起開發出一個極為高效的資料處理引擎來處理這些資料,而且為全球開發者所使用,你是貢獻者之一,那是一個多麼自豪的事情。”

就這樣,在需求和供應的動力下,開源從底層的作業系統開始,充滿了整個開發環境和中介軟體,一直到最上層應用,只要是人們想要的東西,黑客就會把它們實現,如果有一樣東西還沒有開源,那一定還不是黑客很想要的東西,或者是,他們認為這個東西沒有必要開源(比如賴以賺錢和生存的東西,比如比較客戶化的東西)。

所以,我們看到,作業系統Linux、Android;編輯器Vim、Emacs、Atom、Brackets、VS code,版本管理系統SVN、Git;資料庫MySQL、MongoDB、Redis、Postgres;大資料平臺Hadoop、Elasticsearch、Hbase、Spark;Web伺服器Apache、Nginx、Node.js、Tomcat;DevOps工具Jenkins、Maven、Ansible、Chef;虛擬化軟體KVM、Xen、Docker、Kubernetes,如雨後春筍般應運而生,這些列出的和沒有列出的開源軟體,形成了一個完整的軟體生態環境,黑客們已經生活在一個很幸福的時代,他幾乎是想要什麼就有什麼,而幾乎在所有的IT企業和大型非IT企業裡,你都能看到這些開源軟體的身影。

看到這裡,你可能會有所明白,開源,其實是程式設計師送給程式設計師的禮物。

因為真正需要原始碼的人,是程式設計師,真正能寫出原始碼的人,也是程式設計師。

高度開放

對軟體而言,原始碼都開放了,還有什麼不能開放?

這要看情況,軟體開放到什麼程度,完全取決於其許可證(license)。

最開放的情況莫過於“任何人能幹任何事”(anyone can hack anything),也即沒有任何事情可以阻止人們執行該產品,獲取其原始碼、複製其原始碼、修改其原始碼,推進其向不同方向演進,並聲稱是該產品。

這可是太過開放了,以至於拿到他人原始碼後,“克隆”或者“山寨”出一個產品將沒有任何法律層面的壓力,為什麼開源會開放到如此地步?

一方面,在原始碼已經開放的前提下,你事實上很難阻止別人克隆、修改你的程式碼並換個名字釋出。雖然程式設計師通常不會這麼做,但他們不願意有限制,在一個普遍寬鬆的環境下,如果你限制太多,程式設計師就不太會參與你的專案。

另一方面,這是一個鼓勵充分競爭的世界,如果黑客們就專案的方向產生分歧,而又無法達成一致,異見者就可以分叉出來自立門戶。比如,EGCS分叉自GCC,OpenSSH脫胎於走向商業化前的SSH,Veracrypt派生自Truecrypt,再如近年來比較著名的事件:一些人不認可BTC的方向,分叉出來BCH,然後又有人不認可BCH,分叉出來BSV,雖然這個過程中有很多爭吵,但沒有人可以阻止這些。

為了更好地理解開源所給予使用者的高度開放,下面我們看看自由軟體是如何定義它所賦予使用者的自由:(雖然開源軟體和自由軟體並不是一回事,但只有很少的開源軟體不是自由軟體,而幾乎所有自由軟體都是開源軟體,所以這裡我們不去糾結自由軟體和開源軟體的種種區別,而是統一思考為FOSS(Free and Open Source Software),並去理解其背後的初衷。)

如果一個軟體是自由軟體,那麼它必須為使用者提供以下四項基本自由:

自由度0:使用者可以按照自己的意願,自由地執行該軟體,而不論出自何種目的。

自由度1:使用者可以自由地學習該軟體,可以按照自己的意願修改該軟體,所以,使用者首先要能得到原始碼。

自由度2:使用者可以自由地分發該軟體的拷貝,這樣就可以幫助他人。

自由度3:使用者可以自由地分發該軟體修改後的拷貝,藉此,使用者可以將其修改分享給整個社群,令他人也從中受益。

“自由軟體”不等於“非商業軟體”。一個自由軟體必須允許商業使用者、商業開發和商業釋出。商業開發自由軟體早就司空見慣了,這樣的自由軟體非常重要。你可能需要花錢購買自由軟體,也可能免費拿到。但是無論你如何獲得你的拷貝,作為使用者,你的四大自由都會被保證,你可以自由地執行、修改、釋出,甚至出售自由軟體。

你(即,軟體使用者)可以把軟體原版或修改版再發布給其他使用者。你可以免費釋出,也可以收取費用(注:市場經濟下,別人免費釋出,你收費釋出,你要考慮提供如何好處才能讓人買單)。軟體可以釋出給任何地方的任何人。所謂“自由”,意味著你的這些行為不必事先徵得任何人的許可,也不必為此額外支付任何費用。

從以上對自由度的定義可以看出,FOSS的初心是讓人們能夠更好地學習他人程式碼、複用他人程式碼,完善他人程式碼、並可以將軟體分發給需要的人,從而儘可能讓更多的人從軟體和原始碼中受益。

但開源的這種自由開放精神,會不會受到國家的限制?比如受到美國出口管理條例(Export Administration Regulation, EAR)的管制?這個問題曾經成為今年(2019年5月)的關注焦點,參考有關專家解讀,這裡彙總解釋如下。

依EAR,美國人、美國公司將軟體出口至美國境外,或在美國境內提供給外國人作為出口的預備行為,必須申請取得許可。

但符合“公開可獲取(Publicly available)”定義的軟體,不在 EAR 管制範圍(EAR 734.7 (a)),也就是說,多數開源軟體,出口上不需要申請許可。

但 EAR 734.7 (b) 同時說明,公開可獲取軟體雖不需許可,但若涉及加解密技術,仍然必須申請許可,除非是這個加解密技術本身也是公開可獲取的,那就可以採用EAR 742.15(b) 款提供原始碼或揭露原始碼來源的方式,來登入備查。

Apache基金會(ASF)在2019年5月22日通過官博發表宣告,稱:

經美國商務部工業和安全域性(BIS)重新分類(於2016年9月20日生效),開源公開可獲取的加密軟體原始碼,因已是“公開可獲取”和“已釋出”,不再受 EAR 約束。

涉及加密軟體原始碼的開源專案,仍然需要向 BIS 和 NSA 傳送專案 URL 的通知(notice),以滿足 EAR 742.15(b) 中的“公開可獲取”通知要求。

ASF 繼續與 Apache 專案及其社群合作,以確保他們的通知是最新的,並在未來得到維護。

所以,開源軟體是否會被美國出口管制,這個問題基本上不用多慮,原始碼已經在你的手裡,許可證又給予了你如此高度的自由,你還擔心什麼呢,你最需要擔心的問題可能只是:能否讀懂原始碼?

自發自治

所謂開源社群,指的是所有關心、參與、支援、幫助某個開源專案的人的集合。

社群裡的人,是自發組織在一起的。“其中90%是使用者,他們只是搭順風車或是湊湊熱鬧,9%的人積極參與、提交bug、回答問題,這是‘貢獻者’,1% 的人指導並控制專案的走向,委派任務和做決策,這是‘維護者’,或者簡單的說,他們是領導者。”

Eric Raymond在著名的《大教堂與集市》一文中說:“誰能想到,幾千名散佈在全球各地的程式設計師,利用業餘時間,僅僅通過Internet,就鬼斧神工般地造就一個世界級的作業系統?”

他接著說:“多年以來。。。我相信大多數重要軟體(作業系統和真正大型工具如Emacs編輯器)需要像建造大教堂那樣,在與世隔絕的環境下,由天才式專家或幾個行家裡手精心打造,。。。而Linus Torvalds委託所有能委託的事、開放到幾乎混亂的程度,這實在令人驚訝不已,在Linux社群,沒有建築大教堂那樣的安靜和虔誠,倒更像是一個亂糟糟的大集市,充滿了各種不同的計劃和方法。”

Eric提出的問題是,一個大的專案裡,大家平時連面都見不上,那麼,如何把社群裡的人們組織起來,尤其是把編寫程式碼的黑客們組織起來?一個“亂糟糟的大集市”,真的能搭建起一個巨集大而精妙的軟體嗎?書中並沒有給出明確答案。

在一個傳統的軟體公司裡,“組織”並不是問題:確定立項,設立專案組,明確角色和分工,明確需求、目標和計劃,給程式設計師們分配任務,想方設法調動他們的積極性,分配資源、保障進度,檢查品質。在一個理性的公司裡面,有大把的流程和制度在做這些事情,即便在開發中採取了敏捷方法,也是在命令體系下按照既定方法開展的。

但是,在一個完全基於興趣而結合的開源社群裡(這裡先不考慮公司僱傭人全職做開源的情況),你所面對的都是自由人,你只能通過他(她)的自願來獲取合作,如果他(她)願意,他(她)就可以貢獻程式碼,不願意,完全可以不寫任何程式碼(使用就好了),如果他(她)有能力,他(她)的程式碼就可以被採納,如果能力不足,他(她)的程式碼大約就不會採納。

這完全基於個人的意願和能力,一個開源專案的領導者,他所需要組織的,就是發現有能力的志願者,並予以相應的程式碼提交權力。

在一個大型的社群,通常會有以下幾種不同的角色:

1、領導者(Leader):比如 Linus Torvalds,作為核心的創始人,毫無疑問是該專案的最高領導者,在理論上,對Linux核心的任何事務都擁有最終話語權。在另外的一些專案中,可能有一個或多個人共同負責,如 Node.js 專案採用的是核心技術委員會機制(the Core Technical Committee)。

2、維護者(Maintainer):領導者會將一些決策和模組直接委託給維護者,維護者還可以將其中部分工作再委託給下一個層級的維護者。例如,Linus Torvalds 手下就有若干位核心的維護者,負責不同的模組。

3、提交者(committer):有些開源專案會設定一組可以直接提交程式碼到主幹的人,他們已經證明了自己可以勝任工作並且靠譜,而且不再需要提交維護者去進行稽核。但提交者對程式碼沒有最終的決定權,維護者或專案的領導者如果發現了什麼,可以將提交的內容打回去。

4、貢獻者(Developer或Contributor):貢獻者可以做很多事,比如幫助解答使用者的問題,貢獻程式碼或文件,在郵件列表中參與討論,也可以提交程式碼committer。與前面的角色相比,貢獻者對於程式碼的權力要小一些。

5、使用者(User):使用者為專案提供了目標,並幫助專案持續進化,作為社群成員,他們最有價值的部分是提出需求、報告缺陷、提出建議。

雖然Eric用“集市”一詞來描述開源模式,但社群裡的程式設計師可絕不是烏合之眾,黑客可絕不會讓自己的程式碼失控,程式碼永遠要清晰、乾淨、簡潔、優美。只有能做到這些的程式設計師才可以被賦予維護程式碼的許可權,所以,這是一個典型的能力帶來權力的社會,或者說的更直白一些,這是一個精英引領的社會。

那麼,集市模式和大教堂模式有相通之處?

是的,這二者並不是截然對立的。

Linux核心在第一次釋出之前,必然凝結著Linus的精心設計(大教堂模式),雖然它是自下而上寫出來的,雖然它只是一個大學生的暑期作品,雖然它只有大約10000 行程式碼(Linux 0.01 版本)。

然後,Linux走向了開源並吸引了大量程式設計師參與,開發進入了集市模式。現在,參與Linux核心開發的已經有100多家企業和接近4000名開發人員,核心原始檔達到5.3萬個、原始碼達到2100萬行,Linux每天會新增1萬行程式碼,刪除5000行程式碼,修改1800行程式碼,Linux每一小時就會發生8次變化。在外人看來,這的確像是一個亂糟糟的集市,但這並不代表專案失控。

Linus對接十餘名核心維護者,每個人都有自己負責的具體領域和專案內容(例如網路、無線、USB驅動、ext2或vfat檔案系統都有相應的最高負責人),每次有新的開發任務時,Linus會將它分配給對應的人,而這十餘位核心貢獻者又有各自的熟知並信賴的高手小團隊。

Linus不會也不可能親自稽核每個設計和變更,而是按照這樣層級化的結構(大教堂模式?),最終由數百名維護人員負責程式碼審查和整合。在Linus看來,一切都在有條不紊的控制之中(為了更好控制程式碼,Linus還專門開發了程式碼管理工具git)。

這很像是一大群能工巧匠(包括一些建築公司的團隊),不管出自何種利益考慮,為了一個共同的目標,從世界各地自發參加一個大教堂群的設計和建設,Linux核心就是這樣一個大教堂群,每個子系統都是一個大教堂,每個大教堂都有著負責設計和建造的領導人,其下有有著數百名建造高手,他們在共識和規則之下,使用著像git、gcc、郵件列表這樣的設計、建造和協同工具,利用集體的力量(他們會討論,也會投票),把這些美輪美奐的大教堂建造出來。Linus作為最高領導人,不會強制他們,更不會發薪水,一切都是這些高手自發自願自帶乾糧,不管是個人還是公司。

集市模式和大教堂模式的本質區別只是在於:前者是自發的,也是自治的。

自下而上

自下而上是大自然最普遍的法則,開源作為一個從草根社會發展起來的事物,必然會遵循這個法則。

在開源世界裡,至少可以從技術、生態、成就三個層面來觀察這一現象。

從技術上看,縱觀開源歷史,那些非常富有創意的軟體,一開始都是作者腦海中一個不太清晰、朦朦朧朧的想法,然後在作者能力和經驗的基礎上,通過程式碼一步步明晰起來的,中間經過了若干次大大小小的架構調整,經歷過兩三次重寫,然後才終於成型。開源專案在第一次露面時,大多數情況下只是初步可以執行,然後通過其富有創意的特性和前景,吸引更多的程式設計師關注和貢獻。

一開始,Linus只是在Minix上編寫一個閱讀學校網路上Usenet新聞組的終端模擬器,他把自己之前寫的用於測試任務切換能力的兩個程序加以修改,一個程序從鍵盤讀入資訊併發給調變解調器,另一個程序從調變解調器讀取資料,然後傳送到螢幕上;為了實現這些功能,他又寫下了鍵盤和顯示器的驅動程式;為了從學校網路下載檔案,他寫出了磁碟驅動程式,然後又在Minix檔案系統的基礎上寫了一個自己的新的檔案系統;也就是說,他使用Minix作為腳手架,逐步構建了自己的Linux。芬蘭學校的暑假有點長,1991年的暑假更是從5月中旬放到了10月中旬,Linus完全將時間投入到了程式設計之中,一週7天,一天10個小時,全都在寫程式碼。1991年9月,Linux的0.01版就這麼一點一點地做出來了。

從生態上看,開源軟體之間形成的關係,也是自下而上的,先有了語言、編譯器、作業系統,然後在作業系統提供的各種功能的基礎上(比如檔案系統、記憶體系統、硬體驅動等),黑客做出了實用工具(binutils),做出外殼(Shell),做出了程式碼管理工具、整合開發環境,做出了資料庫、Webserver、瀏覽器,做出了虛擬機器,做出了javascript,做出了包管理工具,做出各種應用開發框架和元件,做出了大資料、雲技術,做出了各種面向終端使用者的應用。黑客總是先做出底層的東西,然後才做出上層的東西,而且總是先有實踐,才有了理論,總是先有程式碼,才有了設計模式、架構體系、軟體工程這些東西。從成就上看,絕大多數黑客,一開始都是小打小鬧,從簡陋的程式開始起家,並沒有什麼巨集大的想法,Linus一開始也只是自己玩玩看(《Just For Fun》),並沒有想著要怎麼改變世界,說自己“如果當時真的知道從頭建立一個作業系統的難度,肯定是不會有勇氣去做的”。而到了1999年,Linus在"The Linux Edge"一文中提到:“Linux現在有數百萬使用者、數千名開發者和正在增長的市場,Linux被用在嵌入式系統中,用在機器人系統中,用在太空梭上,我想說我知道這些都會發生,這些都是統領世界計劃的一部分(that it's all part of the plan for world domination.)”,雖然,這也許只是一種詼諧的表達。

扎克伯格一開始做的僅僅是一個讓學生們可以在一堆照片中選擇最佳外貌的程式(Facemash),他做這個也只是因為好玩,後來才開始做了一個用於哈佛大學學生交流的網站:Facebook,隨著Facebook的壯大,在收購WhatsApp、Instagram之後,扎克伯格的成就和抱負也逐漸升級,2017年2月,扎克伯格在一篇宣言中稱“過去10年中,Facebook一直專注於幫使用者連線家人和朋友。下一步我們要成為新的社會基礎設施,保證社群安全、提升每個人在社會事務中的參與度並提高社會的包容性。”,2019年6月,Facebook提出Libra計劃,要“重新創造貨幣,重塑全球經濟,讓世界各地的人們過上更美好的生活”。誰能想象,一個程式設計師,居然就這樣自下而上,做出如此的成就。

順便提一下,開源軟體進入財富500強的方式,並不是Eric所倡導的自頂而下方式,開源並不是因為CEO和CTO的倡導和命令而進入企業,開源仍然以其一貫的方式,以其不慌不忙的態度,以其不可抵擋的實力,自下而上地推入了財富500強。

自由競爭

開源,是一個靠實力說話的世界。

開源軟體在競爭什麼?競爭的是誰的軟體好使,誰的評價更高,以及,最終,是誰獲得了更多的市場份額。

“Talk is cheap, show me the code”,大約是這一點的經典詮釋。1992年1月,有一場著名的論戰,Tanenbaum作為Minix的作者,發帖批評Linux是一個龐大而一體化(monolithic)的作業系統,而非早已被證明更先進的微核心設計,並稱“Linux簡直像是大踏步回到了20世紀70年代,就像拿來一個C語言的程式,再用Basic重寫一遍,在1991年還寫monolithic式的作業系統,真是太糟糕了。”,Linus則回懟“Linux在絕大多數方面都完勝Minix。。。如果微核心是判斷作業系統核心的唯一標準,那你可能是對的,但你為什麼不提Minix並沒有把微核心做的很好,並且在真正的多工(核心層面)方面還有很多問題呢!”。

Linus怎麼會有底氣向一個多年研究作業系統的計算機系教授開火?那是因為他真的做出了比MINIX要好用更實用的核心,而且真的得到了更多的歡迎,所以他才可以這麼說,在理論上,Tanenbaum大約是對的,但在實踐中,Linus勝出了。

競爭比比皆是。

2004年,在Apache佔據最大Web server份額的年代,俄羅斯人Igor Sysoev開源釋出了Nginx(和Engine X諧音)。Nginx的一個明確目標就是超越Apache Web伺服器的效能,它使用非同步技術,成功解決了C10K(Concurrency 10K,1萬併發)問題,以其佔用記憶體少、併發能力強、配置靈活簡單等驚人效能,很快得到了廣泛採用。截止2019年6月,在全球流量最大的前100萬個網站中,Nginx佔有率已經從10年前的3%上升到現在的27%,而Apache的市場份額從66%下滑至32%,微軟的IIS則從19%下滑到9%。在流量最大的前1萬個網站中,Nginx的使用率已經超過了Apache(30% vs 29%)。

2015年,Google開源了Kubernetes,它基於Google自2003年起就在內部使用的叢集管理工具Borg,很快,微軟,紅帽,IBM和Docker加入,Google更是與Linux基金會合作組建了CNCF基金會(Cloud Native Computing Foundation ),將Kubernetes作為種子技術來提供。現在,Kubernetes有380家企業和2500多名開發者參與開發,在和同類專案Swarm以及Mesos的競爭中,Kubernetes很快佔領了容器排程編排領域的絕對領先地位。

軟體在競爭,個人也在競爭。

個人競爭的法則很簡單,如果你的貢獻——當然主要是指程式碼的貢獻——得到了同儕認可,你就會獲得聲譽和權力。

2019年6月,ASF官方部落格宣佈全球新增 40 位 Apache Member,阿里的張乎興有幸成為其中一位,此時,全球共有771位 ASF Member,中國僅13位(member有權利選舉board、成為board候選人、推選其他member,提議將某專案納入ASF孵化器)。他是怎麼做到的呢,張乎興記錄了這個過程,以下是節選。

2014年我加入阿里巴巴中介軟體團隊,開始接手阿里巴巴集團應用容器的維護工作。當時中介軟體團隊維護了 Tomcat 的一個私有分支,最大的目標就是要統一所有集團的應用容器為Tomcat。

Tomcat 自1999年釋出第一版以來,一直是開源界和 Apache 基金會的明星專案,至今仍然在應用容器領域市場佔有率保持第一,歷經20年發展,依舊熱度不減。Tomcat歷經這麼多年的發展,卻從未出現過一位來自中國的committer。

我從修復 bug 開始。第一個patch是修復一個Websocket 測試用例失敗的問題,修復該問題涉及到了對程式碼的一些重構。還記得當時提交之前我非常謹慎,和 leader一起反覆討論了很多次,終於形成了一個比較滿意的方案。提交給 Tomcat 社群之後,很快,社群便有了響應,併合並了我提交的補丁。看到Tomcat的release note裡面出現了自己的名字,真的非常開心。

嚐到了貢獻的甜頭後,團隊的目標也有所調整。內部版本的Tomcat和開源版本的結構要保持完全一致:使得合併開源Apache Tomcat變得非常容易;內部做的增強也更加方便合併到社群。

後續向社群的貢獻,主要來源於三個方面:第一:阿里內使用 Tomcat,在大規模、高併發場景下遇到的問題修復。比較典型的是當時無線閘道器應用採用的是Tomcat NIO+AsyncServlet的架構,作為一個入口應用,曾經因為Tomcat 在高併發下的異常出現過一個比較大的故障,後來排查這個問題花了非常多的精力,最終徹底修復了這個問題。第二,Tomcat 大面積在阿里鋪開時遇到的問題修復。例如,發現了一些不符合 Servlet 規範的行為等。第三,主動參與開源社群,針對一些一直存在的問題的修復。

2016年8月23日,在一個平常工作日的上午,我開啟郵箱,看到一封來自Tomcat社群核心開發、Java EE規範專家組成員、時任Apache基金會董事會成員Mark Thomas的來信,邀請我成為Tomcat Committer。開啟郵件的那一刻,感覺自己的心都在顫抖,激動之情有點不能自已。

2017年,阿里重啟了 Dubbo 的開源維護工作,並決定把 Dubbo 捐獻給 Apache 軟體基金會。已經有過幾年 Apache 社群參與經驗的我,自然地承擔起幫助Dubbo進入Apache 基金會孵化的工作,從聯絡導師到修改提案,終於,Dubbo通過了Apache孵化器的社群投票,正式開始孵化。

第一次的 release,是孵化過程中很重要的一個里程碑。在我看來,release的意義遠大於程式碼層面的工作,還包括了準確的 License 和版權宣告、符合規範的程式碼及依賴、準確一致的簽名等。Dubbo 花了很多的時間去準備,也把整個過程完全的文件化,孵化過程中,由7位不同的 Release Manger 輪流負責,確保不同的人都可以完成釋出。

在 Dubbo 即將畢業的前夕,突然有一天,我按慣例開啟郵箱,突然發現躺了一封 Invitation to join The Apache Software Foundation Membership。我心中一陣驚喜,點開之後,發現是邀請我成為ASF Member的郵件,這讓我非常的出乎意料。

在ASF基金會裡,一名新的member,是現有其他member提名和選舉出來的,張乎興獲取如此地位,依靠的是他的能力、貢獻以及同儕對他的認可。

贏在聲譽

黑客將自己的程式碼貢獻出來,能得到什麼?

除了專案發展、能力增長、回饋社會、自我實現之外,最大的好處莫過於聲譽。

這也是很多黑客貢獻程式碼的初衷,TDengine的作者陶建輝很直接地說出這一點:

“錢再多,也難讓人在歷史上留下痕跡,但一幅好的作品卻可以傳承,讓後人好好的品味。願我領頭開發的TDengine成為傳世之作,Leave a dent in the world!”

聲譽會帶來直接的好處:一旦某人在開源社群建立起自己的聲譽,基本上他就不再會為職業生涯發愁,他們會非常搶手,儘管他們往往是分佈在全球各地,但這不妨礙企業爭著僱傭他們。

正如Autodesk 開放總監Guy Martin所言:“如果你打算僱傭一名維護者,或是想僱一名厲害的貢獻者,請時刻牢記,這些人被很多公司盯著,而且他們是這個世界做著足夠靈活的工作的人,這也就意味著,他們雖然從一家公司換到另外一家公司,但是卻在同一個專案中工作,唯一改變的是簽署薪水的公司名稱。”

聲譽帶來的更多是無形的好處:你說的話會有人聽,你要做的事會有人支援,會有人更多的人願意和你合作。

現在,開源貢獻的主流力量已經轉變為公司,各類大型企業尤其是網際網路企業,開始以各種方式釋出自己的開源專案,企業為什麼要把自己專案開源出來?

道理是一樣的,如果得法,企業不僅可以獲得聲譽,還會獲得更多好處。

37signals是一家非常小的公司,員工很少,但在業內卻非常出名。它的出名,很大程度上得益於員工大衛·海納梅爾·韓森在工作的時候,用Ruby寫了一個劃時代的web快速開發框架——Ruby on Rails,其革命性的設計理念,大大的提升了WEB網站的開發效率。37signals選擇了將此專案以開源的方式釋出,在業內引發了轟動效應。在37signals出版的暢銷書《Rework》裡,有一段這樣的文字:最好的大廚都樂於在公共頻道上教授自己的廚藝,這不僅無損大廚的商業利益,反而大大增加了大廚的知名度,對大廚來說這是非常棒的舉措。

具體會有些什麼好處?

首先,專案會因開源而獲得成長

Google對其人工智慧系統TensorFlow的開源決定就是基於這種考慮做出的,Google首席科學家Jeff Dean指出,傳統的軟體研發實在是太慢了,通常是一個程式設計師花上幾個月寫完程式碼,然後上會討論,再根據其他人的意見進行相應的修改。相比之下,如果採用開源的協作開發形式,Google開發人員能夠實時與外界進行協作,Google之外的人也能參與TensorFlow的編寫和完善,TensorFlow的開發進度就大大加快了。

濤思公司在將TDengine的核心部分開源之前,也經歷了反覆的討論和思考,最終在深思熟慮之後,決定開源,其官網上寫道:“濤思資料將盡最大努力打造開發者社群,維護這個開源的商業模式,相信不將最核心的程式碼開源,任何軟體都將無法贏得市場。濤思資料希望通過開源,快速獲得市場反饋,完善產品,完善生態,而且吸引更多的開發者加入到這個專案中。”,如果你去github上看一下,就會發現,開源僅僅兩週內,TDengine就收到十多個修改建議(PR),其中不乏一些修復記憶體洩漏、防範段錯誤之類的高品質patch。

其次,開源產品可能會獲得大量使用者使用,佔據份額優勢,然後再通過其他方式賺錢

2007 年,Google開源了花幾億美金買來的Android,希望直接和 Apple、Nokia、BlackBerry 展開競爭。在此之前,塞班系統曾一度佔據了手機作業系統的榜首,而蘋果的iOS系統也風頭正勁。然而,在安卓出現之後,只用了很短時間就奪下了手機作業系統市場第一的位置。根據Gartner釋出的資料,2018年安卓在智慧手機系統中佔有的份額高達85.9%,位居第二的iOS系統佔據份額14%,其他各種系統的市場份額加在一起只佔0.1%。Google並不對andriod收取任何費用,但對於系統搭載的Google搜尋、Google地圖等各類應用,卻可以收費獲利,這和網際網路企業通過免費贏得使用者然後通過會員收費有異曲同工之妙。

Kafka由LinkedIn公司於2011年開源,並在2012年底從ASF孵化器畢業,正式成為ASF的頂級專案。2014年,Kafka的三個主要開發人員從LinkedIn出來創業,開了一家叫作Confluent的公司。Confluent的產品基於Kafka,其中Conflunt open source是Kafka的增強版本,仍然開源免費,但企業版Confluent Enterprise則是收費的,主要是裡面增加了一個非開源的Confluent Control Center,實現對整個產品的管理和控制,可以對Kafka裡面各個生產者和消費者的效能進行監控。

由於開源,Kafka已經在很多企業裡被作為關鍵元件部署,但社群版kafaka自身並不自帶效能監控平臺,雖然也有公司自己開發了這樣的系統,但無疑Confluent開發的東西應該是最可靠的,畢竟沒有人比Kafka的開發者更了解自己的產品。現在,Confluent公司的年預訂量已超過1億美元17,之所以可以大賣,其基礎就在於Kafka已經得到了廣泛使用。

這是自Redhat創立以來,許多開源創業公司(如Cloudera、Elastic等)採用的商業盈利模式:將“社群版”開源,然後售賣該產品的“企業版”( 企業版內含更多的功能,或者和社群版完全一樣,僅僅是從GPL許可轉為非GPL許可,如MiniGUI的做法),售賣雲服務版,售賣對產品的支援和服務。所以說,企業開源自己的專案,並非不能賺錢,只要能積累起大量使用者,就可以通過更誘人的功能,吸引使用者花錢購買更高階的產品,而且,開源創業公司還可以“原廠”的身份,為企業提供技術服務,為企業解決後顧之憂。

吸引人才

將產品開源,如果能建立良好的聲譽,會讓開源開發者對公司產生興趣,而公司則可以從開源貢獻者中選取人才,這提供了一種互相發現對方的機會,招聘到這種人才是非常划算的,因為該程式設計師的能力早已在專案的貢獻中得到檢驗,而且入職後無需磨合就能夠直接上手工作。

現在再回頭看,公司能從開源獲得什麼?至少有這麼幾點:獲得聲譽,獲得合作,獲得使用者,獲得客戶,獲得員工。當然,公司不會同時獲得這麼多,公司也未必想要這麼多。

雖然有這麼多好處,企業在開源專案前仍須三思,要綜合權衡利弊再做決定。微軟近年來以實際行動大力擁抱開源,也開源了不少專案,但顯然還不會把最新版的Windows和Office開源。

社群賦能

Apache有一句格言叫”社群重於程式碼",它強調的是:一個健康的社群遠比良好的程式碼重要。如果程式碼消失, 一個強大的社群可以重寫它;但是, 如果一個社群不健康, 程式碼最終也會失敗。

背後的邏輯是明顯的,與程式碼相比,人是最重要的。開源軟體的生命來自於人,一個軟體還活著,體現為它還在被執行,還在被維護,如果沒有人關注和維護,這個軟體也就走到了盡頭。

“眾人拾柴火焰高”,社群越強大,專案繁榮的可能性就越大。近年來,公司作為一股強大的社群力量(根據25週年版的Linux Kernel開發報告,個人志願者貢獻的程式碼比例降低到了7.7%,大部分程式碼都是企業貢獻的),不僅把自己的專案開源出來,還會在使用他人開源專案的同時,對上游(也即這個開源專案)社群作貢獻。

有人會問,如果說公司將自己的專案開源會有利可圖,那麼,僱傭全職員工參與上游開發這件事,會有什麼好處呢?為什麼一定要給上游做貢獻,fork程式碼過來直接自己搞難道不行嗎?

這句話值得好好思考一下:“如果某個開源專案對你公司的產品起著非常致命的作用,而你的公司又只有一人在為上游做貢獻,你就處於單點故障風險之中,你必須要有連續性計劃,你需要有一打以上的人做這件事。”

公司將開原始碼下載然後自己搞,當然可以,但這是一種遠離社群的做法,隨著時間推移,想要從社群的下一個版本中引入修復bug或新的功能,付出的代價就會越大。所以,最簡單的方式就是讓自己的員工花時間甚至是全職的時間參與到開源專案中,花這個錢是值得的。前面所述的阿里對Tomcat做貢獻的例子中,就很明白地說明了這個問題。

阿里、騰訊、百度、華為、中國移動、招商銀行等國內企業近年來已經將開源作為戰略行為,不斷將自己的專案開源,並積極參與上游專案,通過其貢獻,已分別被Apache 基金會、Linux 基金會、 OpenStack 社群、MariaDB 基金會等接受為白金、黃金或白銀會員,這意味著中國公司在開源社群開始有更多的話語權和影響力。

最後,有必要略微介紹一下基金會,它為什麼會存在,它主要起什麼作用?

首先看看由純粹程式設計師組成的社群,可能會有什麼問題。

1、可能缺乏管理。一個健康的社群需要及時處理issue和PR,需要有健康的討論,需要有正常的釋出頻率,這樣才會聚攏人氣,才會吸引更多的關注和貢獻。而黑客幾乎完全是由興趣驅動的,他們有時候也會犯懶,專案有時會沉睡,一些取悅使用者的功能會遲遲不被實現,專案會失去其所需的活躍度。

2、可能缺乏運營。想促進專案更好發展,有些非編碼性質的工作是必要的,比如品牌建立、推廣、運營、捐贈獲取、法律訴訟、培訓、認證等等,但對於醉心於技術的黑客,他們即便認識到重要性,即便有能力,可能也缺乏主動性去做這些,這些事情需要有專門的人士來做,也需要專門的經費。Linus曾說:“如果你是一名工程師,很有可能你只想處理自己感興趣的技術問題,其他一切事情你都想移交給別人來處理。。。很慶幸自己不需要擔心商業和管理的問題,只要能領到工資不擔心養孩子上學的問題就很好”。

3、可能缺乏治理。開源專案大到一定程度,在多個公司捐贈和參與貢獻之後,企業之間、企業和社群之間的衝突如何處理和調和?這屬於治理層面的問題,也是頗讓人費腦筋的問題,黑客可不一定喜歡這個。

所以,基金會應運而生,在非盈利和良好願望的前提下,搞定這些在黑客看來略顯無趣的事。

Apache軟體基金會(ASF)成立於1999年,是全球目前最大的開源軟體基金會。20年來,它發展和孵化了350多個開源專案,像Apache HTTP server、Ant、Hadoop、Kafka、Maven、Struts、Tomcat、Zookeeper等,都是它的專案。ASF依美國非營利慈善組織條例 501(c)(3) 設立,其成立宗旨是:“為公眾利益創造免費的軟體”。基金會由董事會(Board) 來管理,董事會目前由九名成員組成,每年由所有ASF member投票選出。

Linux 基金會也是非營利組織,其宗旨為:“促進、保護和規範Linux,圍繞開源專案建立可持續的開源生態系統,促進技術發展和商業採用”。像Linux、Hyperledger、Jenkins、Let’s Encrypt、Node.js、Kubernetes、Opendaylight、Xen這些都是Linux基金會旗下的專案,和ASF不同,通常是頂級企業會員有機會進入董事會或是各種技術決策委員會(TSC),其董事席位主要是由企業會員選出的。Linux基金會明確指出,基金會所獲資金,主要用於基礎設施和從事開源開發的人,包括Linus Torvalds。

後記

七大理念就說到這裡了,如果要細究的話,其實還可以再整出幾條的,比如什麼“樂於共享”、“重在使用者”、“共識驅動”,“高度透明”、“精英引領”、“協作增效”之類的,但是我覺得有這七條也就基本能說明問題了,而且所有這些理念都是相互關聯的,關鍵是理解開源背後的動力結構和其所不可抵擋的優勢。

總的來說,從需求上講,人們需要原始碼實現高度自主和安全可控,從供應上講,提供原始碼有利於贏取更多的關注、聲譽、使用者和市場;開源的高度開放和自由使人類智慧得到更好的共享和發展,降低了學習成本、複用成本、改進成本,打破了技術封鎖;開源提供了更自由的競爭機會,使那些能力強的人和軟體脫穎而出;開源,最終造福整個軟體業和整個社會。

時至今日,80%以上的智慧手機使用開源,90%的公有云負載使用開源,60%的嵌入式系統使用開源,連微軟都在windows 10中內嵌Linux,那麼,有什麼理由不相信,開源正在慢條斯理地吞噬整個世界?

wei_sir 作者

Roy 排版

內容僅供參考 不作為投資建議 風險自擔

最新評論
  • 整治雙十一購物亂象,國家再次出手!該跟這些套路說再見了
  • 如果快手早兩年開放公會入駐,一定不是現在的格局