趙生宇眼中的開源,是一種開放式組織形式,是對現有生產關係的變革。當他說要做開源時,不僅是寫程式碼,還包括探討這種新的組織形式的理論意義、治理框架、社群維護、運營工具等等,就像很多人看到的那樣:開源是個筐,什麼都往裡裝。
2013 年,趙生宇攝於騎行路上。
33 歲的趙生宇正在同濟大學計算機系讀博士二年級,專門研究開源,擅長製作開源治理自動化工具。
身邊的人,有時甚至他自己都會不解一路走來的選擇。但是,逐漸地,他在開源的道路中知道了自己真正想要的是什麼。
“在開源世界中的探索給人一種自由的感覺。”這才是趙生宇一直追求和嚮往的,對他來說,遨遊在開源世界的感覺就好像他在 2013 年獨自騎行一個多月橫跨大半中國一樣,彌足珍貴,“現在作為學生自由地探索開源和當時騎行的感覺也非常類似,很累,比較孤獨,但非常自由,是一種追夢的感覺。”
從西寧市至北京市,趙生宇 2013 年騎行路線圖。
在寫程式碼與做開源之間橫跳
“我一直覺得,我是一個技術背景的人,應該做一輩子的研發或程式設計師,但同時我又始終被開源吸引,所以就會在不同崗位之間反覆跳。直到找到一個非常好的結合點,把我興趣和技能結合起來。”
一
2015 年,Apache 基金會聯合開源社籌辦 Apache Roadshow 2015 China 活動。還在讀研的趙生宇經同學推薦,以學生志願者身份參會,給時任 ASF 副總裁的 Niclas Hedhman 做隨身翻譯。會上來自 ASF 的成員講述了 Apache way,開源治理,大資料生態體系等等。在閉門圓桌會議上,技術界的眾多大咖齊聚,暢談技術發展歷史與趨勢,這給了他很大的衝擊。
Apache Roadshow 2015 China 閉門圓桌會議,趙生宇以學生志願者身份參與會議記錄,圖中有 Apache VP Niclas Hedhman、微軟計算機科學家,Delphi、C#、TypeScript 之父 Anders Hejlsberg、Apache ServiceComb 負責人姜寧、Apache Kylin 負責人韓卿等。
因為作為會議志願者表現優秀,大會組委會成員陳陽給了趙生宇一個到微軟做社群運營的實習機會,當時拿了校招 Offer、並已經在美團開始資料治理工程師崗位實習的趙生宇辭職去做了一名運營:
“那是非常大的一個轉折點,但是當時我對開源的認識還是非常模糊的,就知道開源是很有意思的一件事情,很有趣的一群人在做一些看起來非常有愛的事情,而且有機會和技術界的大咖面對面的交流。”
二
畢業之後,趙生宇找了一份“老本行”工作,在網易遊戲做一名研發工程師。任職網易期間,他一直沒有間斷參與開源社群的活動,或多或少都會出些力,比如做志願者招募,協調場地,會務處理等等。
有一次,他專門請假從杭州去上海,協助開源年會的舉辦。老闆問他幫忙是不是有錢拿,他說不是,大家都很不解。
“具體為什麼我自己也不太清楚。”直到現在,趙生宇依舊不太理解自己當時的動機,只是用“感覺非常好”來形容,“大家會覺得你是一個志願者,非常有個性地把這件事組織好了,那大家就非常認同,給你豎個大拇指,你就會很開心。”
結合點
結合點就是開放式組織的數字化治理,用數字化工具讓開源運營更簡單。
入職阿里兩個月時,趙生宇接到任務,去採訪他們運營的某個開源專案的 contributor(貢獻者),和每個人深入交流。工作第一步就是獲取每個 contributor 的聯絡方式。由於 contributor 都是 GitHub 上的程式碼提交者,想找到他們可以去看程式碼提交時的關聯郵箱,或者看個人主頁是否留下聯絡方式。傳統運營此時的做法大機率是維護一個列表,找到每個人的資訊,實時更新表格。
“我是學計算機的,所以立馬想到可以寫一個指令碼自動獲取這些資訊。”趙生宇的技術背景優勢在此刻凸顯。
緊接著,他發現 GitHub 本身開放了大量資料,可以做各種資料的持續採集和分析。完成之後,他意識到這件事非常有價值,可以大幅度降低傳統運營的人力成本,實現自動化。於是向公司提出想要轉變自己的工作方式,“我不希望做傳統運營的那些事情,我希望做和數字化相關的事情,比如做軟體工具,從 GitHub 上爬取資料,分析資料,進而支撐傳統運營的工作。”
這種想法進一步實現的是 2018 年,阿里想要對外發聲,需要評估阿里在全球開源生態中扮演什麼角色,怎麼定義貢獻之類。公司談論開源貢獻往往可以很容易列舉出共開源了多少專案、專案有多少個 star,在全球有多少貢獻者,為開源開發投入多少資金等指標,但很難評估出公司在全球開源生態中的地位。上述這些可見指標中也或多或少與實際情況有偏差,比如 star 可以刷,開源專案的多少並不代表質量等等。而這次任務就引出了趙生宇到現在還一直在做的事情——GitHub 全域資料分析。
2019 年 Linux Foundation 主辦的 Open Source Summit 上海站,趙生宇代表阿里巴巴介紹數字化運營方面的工作進展,其中就包含對於 2018 年全年 GitHub 資料的全域分析的初步結果。
“長遠來講,如果可以實時分析非常活躍的開發者在不同專案之間遷移的過程,其實能洞察整個技術世界的發展趨勢,這件事對公司的技術戰略非常有幫助。”趙生宇擅長大資料處理,利用他擅長的技術洞悉開源的發展規律剛好是結合了興趣與個人技能。
去年,趙生宇還以同濟大學與華東師範大學聯合主辦的 X-lab 開源實驗室成員的身份,正式釋出了他基於 GitHub 全域日誌的圖資料分析成果 OpenGalaxy 2019——開源星系 2019,介紹了一種基於開發者協作網路的全域專案影響力評估與專案聚類演算法。開源星系 2019 是目前已知全球第一張也是唯一一張 GitHub 全域專案全景圖,包含 2019 年 GitHub 全域 17 萬個較活躍專案的影響力和聚類結果。
2020 年,他也在 X-lab 實驗室的 GitHub 組織下開源了 GitHub 數字分析的專案,將全域資料分析的能力整合到 GitHub CI 中,使更多人可以一起參與到全域數字分析的協作中。X-lab 也將在 2 月份釋出《GitHub 2020 資料洞察報告》,更全面的展示他們在 GitHub 全域資料分析上的成果與進展。
OpenGalaxy 2019,展示了 GitHub 上 2019 年最具影響力的 17 萬個專案的全景圖,節點的大小表示了專案的影響力,而不同的顏色則表示了專案所屬的領域。
GitHub 全域資料分析是趙生宇為自己找到的,個人技能與興趣之間,即寫程式碼和做開源之間的結合點。
而在阿里接近兩年的工作經驗,也讓他對開源本身有了更多猜想。
帶著問題回學校
剛加入阿里時,趙生宇所在團隊僅僅是負責一個專案的運營,之後團隊迅速擴大,成為阿里開源辦公室,開始統籌阿里集團的開源工作。
期間,他做過活動、內容、數字化運營、開發、訪談、報告,甚至是績效評估、風險管理等等。也真正從企業內部認識了開源,從運營和治理的角度看開源,開源在他眼裡不再僅僅是一群有熱情的人聚集在一起做一些看起來沒有收益的事情,而是要立足企業治理,從公司戰略層面去思考和行動。
換個角度看開源,新的問題出現了:開源治理的框架應該是什麼?應該用什麼樣的角度去看待開源?在不同的角度上應該用什麼方法去解決什麼樣的問題,達到什麼樣的效果?
“想搞清楚這些還沒有多少人探究過的問題,最好的地方就是學校。”對開源的強烈求知心驅使趙生宇重新規劃人生路徑,他決定換個環境去思考。
說來也巧。趙生宇曾在一次開源社群活動上認識了他後來的博士生導師之一王偉,幾番交流之後二人日漸熟悉起來。2019 年 5 月,王偉給趙生宇發訊息,說自己剛好有一個博士的位置,和開源相關,問趙生宇是否有意願。
趙生宇非常心動,就說:“我來。”
2019 年 9 月,趙生宇從阿里離職進入同濟。回到學校的他有了更多的時間做研究,開始學習管理學、經濟學等人文學科知識,在跨學科背景下看開源。由於他本碩都是讀的計算機系,高校研究制度不允許無跨學科背景的人做跨學科視角研究,於是,趙生宇就開了課題“從全域資料中挖掘協作模式”,大的興趣方向是跨學科視角下的開源理論研究和開源專案工具開發。
至此,趙生宇的開源探索有了一個大致的框架。
他堅信開源作為一種開放式組織形式,可以變革人類社會現有的這種生產方式,尤其是公司。
而從組織形式的角度看開源,開源就需要一整套的治理框架。同時,基於此框架的數字化、自動化的治理工具也能幫助開源專案及社群更高效的運作和管理。
猜想印證
2020 年年初的一個專案,讓趙生宇進一步確定了兩件事:一是開源可以是各領域生產關係的變革,而不僅僅是軟體開發;二是開發自動化協作工具的可能性與重要性。
2020 年 1 月 23 日,除夕夜前兩天,武漢因新冠疫情封城。突然的災難打破整個社會的陣腳,和大多數人一樣,趙生宇的所見被來自醫院、醫生、病人等各方的求助填滿,“就是在除夕當晚,我記得非常清楚,大概從八九點開始,朋友圈、微博、微信群非常多這樣的資訊,大家都在轉,我心裡也非常不舒服。”
然而此時的趙生宇滿心焦灼卻無法施以援手,許多可信的捐款平臺資金池已滿;一些求助資訊以圖片形式傳播,長串的銀行賬號在圖片中傳播難以使用,用他的話來說就是:想捐個款都太難了。
除夕夜當晚,趙生宇難以入睡,“作為計算機系的人,那段時間也一直在做資料相關的事情,看到這些就有直覺,想是否可以做一個數據平臺解決問題……”
Wuhan2020 專案啟動了。
Wuhan2020 的定位是武漢新型冠狀病毒防疫開源資訊收集平臺,需要收集的具體資訊包括醫院、酒店、物流、生產、捐款、預防與治療、義診、動態。最初的設計是參與者可以到 GitHub 上提交 csv 格式檔案並存儲,以便前端獲取結構化資料。
很快,趙生宇發現,GitHub 本質是一個程式碼協作平臺,提交表格類資料非常困難;另外國內許多程式設計師對 Git、GitHub 並不是很熟悉,因此協作效率不高。第二天,趙生宇和實驗室的同學去調研線上協作表格工具,最終選定石墨表格。
石墨表格是一家武漢科技公司的產品,得知 Wuhan2020 專案有意使用石墨表格之後,石墨的一些工作人員以個人身份參與進來,幫助對接了部分資訊採集的團隊,有收集新聞事件的團隊,也有做疫情防控知識文件協作的團隊……
解決了資訊採集的問題,接下來是資料的加工、處理、視覺化。
趙生宇和石墨產品的開發者配合,寫了一個連線石墨和 GitHub 的自動化工具,將石墨作為資訊的採集端,GitHub 作為程式碼採集端,中間透過自動化程式連通。每隔兩個小時從石墨表格裡採集資料,過濾掉未稽核的資料,然後校驗每一列,檢查出格式不匹配的資料後上報錯誤;沒有問題的資料裡,抽取出聯絡人電話號碼、賬號、地址資訊等資料並進行自動化二次加工,打包成資料包上傳到 GitHub 的資料倉庫,轉化成開放的資料,這時大家就可以直接拿開放資料做應用。
越來越多貢獻者湧入專案,最終 Wuhan2020 在半個月內完成開發,參與者多達四千多人。
Wuhan2020 有三個專案在同一天內登上 GitHub Trending 榜全球 Top 5
一個德國開發者基於 Wuhan2020 做了款手機 APP,直接讀取 Wuhan2020 的資料顯示在手機上。
美國醫療公司 Button 用資料做了面向海外的網站,促成一筆武漢醫院從歐洲採購了上百萬美元醫療物資的交易,也有美國人透過這個網站捐助口罩等物資。
透過來自社交網路的反饋,趙生宇也知道有很多人透過這個專案,一鍵複製銀行賬號,完成捐款。
……
“如果說 Wuhan2020 解決了多大的問題,我覺得並不是。”對於 Wuhan2020 專案取得的成績,趙生宇並不是非常滿意,他認為首先 Wuhan2020 沒有打通全鏈路,如捐款、捐物等;其次,美國醫療公司 Button 只是個例,具體多少人使用 Wuhan2020 並不能追蹤,因此無法準確評估價值;此外 Wuhan2020 釋出時間特殊,“專案本身有一個很重要的前提條件,它發生在那個時間節點,很多因素都非常巧合的碰到一起,這個專案才會產生。”
Wuhan2020 對趙生宇來說更重要的結果是印證了之前的一些猜想。
一是 Wuhan2020 探索了開放式的組織形式,證明開源可以是對各領域生產關係的變革。趙生宇認為,Wuhan2020 區別傳統意義上的技術開源,是一個非典型的開源專案,研發僅是一小部分,參與者有許多都是非開發者,比如貢獻資料的學生團隊、設計團隊、宣傳團隊、運營團隊等,而且他們也與上游的工具廠商有緊密的連線,“當時 Slack、Figma、石墨、句子互動也都給了我們商業版的免費支援”。
並且它印證了開源這件事不僅和軟體相關,更是對整個組織甚至跨組織管理的變革,對人的生產關係的變革。生產關係的變革是指不同領域的人們可以在沒有簽訂勞務合同,沒有過多外力強制的前提下,出於共同的願景和目標去從事生產。
二是 Wuhan2020 證明了開發自動化協作工具的可行性和重要性。Wuhan2020 專案是來自各地、各領域的貢獻者用多個協作工具創作,並透過自動化工具連線的:資料收集志願者用石墨表格協作資料;有北美設計師用線上協同設計平臺 Figma 做 UI 設計協作;開發者在 GitHub 進行程式碼協作;而他們也自己開發了工具用於跨平臺的資料同步與許可權管理。基於這些協作平臺與自動化工具,所有人才有可能構成一個完整的協作組織。
開源對人意味著什麼?
“站在幾十年後、一個世紀以後回望的時候,開源對於人類到底意味著什麼?”
Wuhan2020 激發了趙生宇更多思考,之後的 2020 年,他更多地去閱讀跨學科的書籍,尤其是經濟學、管理學、社會學:
對這個目標,趙生宇還沒能給出一個確切、甚或是大概的答案,但他已經透過不同學科理論更理解開源。目前最讓他受益匪淺的兩個學科是新制度經濟學與管理學。
其中新制度經濟學強調從制度成本的角度去分析組織的有效性,制度成本理論讓他意識到開源社群的有效性在於“不能提高效率就終會消亡”。
如果組織管理和研發管理的問題較多,生產成本較大,就註定會走向消亡,無論在開源還是傳統企業中都是如此。開源雖然在組織邊界有限開放的情況下在某種程度上降低了產品獲客和技術品牌建設與宣傳的成本,但與此同時開放式的協作帶來的挑戰更多。
雖然現在很多人都認同“一個專案是否認真做開源,看 CI 就知道了”的說法。但趙生宇認為,未來的自動化手段將不僅是 CI 系統。CI 僅僅解決了大規模協作中的測試與信任成本高的問題,未來的自動化工具同時還需要關注組織的成員架構管理、許可權管理、研發流程管理、績效評價、社群運營等一系列與開源相關的生產環節,而每個環節的自動化都是對制度成本的降低,從而增加組織的有效性,使社群可以更加平滑的運作。這也從理論層面加深了他對自動化工具重要性的認識。
另外,新制度經濟學打破了新古典經濟學中的“完全理性人”假設,將“有限理性”作為一個基本假設,這使得趙生宇可以跳出純理性的收益分析來看待參與開源。
不同學派對於有限理性根源的探究,為趙生宇理解開發者行為和探究開發者運營策略時提供了諸多耳目一新的角度。
管理學中關於“情緒對生產力影響的研究”也印證了這個觀點,社群中開發者的歸屬感與認同感導致的驅動某種程度上是非理性行為,而且一些紀念品、證書等雖然沒有實質的收益,卻在情緒層面影響了開發者與社群的關係,從而進一步影響了開發者的行為。
“我本人在生活中有點極簡主義,很多時候我會覺得紀念品是一種累贅,但收到時依然會非常開心。”趙生宇作為一個工科生一向喜歡用非常理性的視角來看待世界,其他學科的理論往往能給他一些新的視角。
王偉老師在上海開源資訊科技協會發起的開源社會工程研究框架,旨在透過跨學科領域的協同研究促進開源研究的發展。
趙生宇在不同學科中得到的啟發還有很多,雖然還沒求得最終解,但他已經確定要和開源難題死磕了:“2021 年可能會產出一些內容,但不會達到預期中非常完整的理論框架的程度……實踐方面也是做好工具之後,把需要實踐的理念注入工具再去服務社群。”
現在,他還會以 Freelancer(自由職業者)的身份做外部開源諮詢,加深對開源現狀的瞭解。和研究開源的同學呆在一起時,他們也會暢想新的未來:
未來是否會有大量的開放式組織,人們可以不用簽訂獨佔勞動力的勞務合同,不用固定坐在一個工位,可以選擇我要做什麼樣的事情,可以選擇在哪些組織裡做事,可以更自由地工作與創造……