“飛槳”,顧名思義,想讓深度學習領域的開發者順利渡河靠岸。10月16日,在首屆世界科技與發展論壇上,百度釋出了飛槳產業級深度學習開源開放平臺。
飛槳以百度多年的深度學習技術研究和業務應用為基礎,同時與華為等晶片企業深入合作,集深度學習核心框架、基礎模型庫、端到端開發套件、工具元件和服務平臺於一體,於2016年正式開源。它的開源開放,降低了AI技術門檻,已累計服務150多萬開發者。
要開源,也要自主可控
“深度學習是新一代人工智慧的核心支撐。”王海峰介紹,在人工智慧的技術體系中,深度學習框架處於硬體層和應用層之間,其作用相當於個人電腦時代的Windows和移動時代的Android/IOS,堪稱智慧時代的作業系統。以深度學習框架為核心的深度學習平臺,是人工智慧技術研發和產業化的關鍵基礎設施。
不過,如果要獨立研發深度學習框架,搭建完整的深度學習平臺,需要強大的技術支撐。迄今為止,全球範圍內能夠做出功能完備深度學習平臺的企業,只有Google、Facebook等少數幾家。而它們推出的深度學習開源平臺,也確實在全球人工智慧領域佔據很大份額,不少國內企業同樣使用。
不過,國內企業也不能只想著“背靠大樹好乘涼”。畢竟,深度學習框架是如此重要,若只依賴少數幾個,難免會有掣肘;況且,不同國家人工智慧發展特點並不一樣,開發者也需要更能滿足自身需求的平臺。
而且,開源深度學習平臺若與人工智慧晶片結合,便能發揮軟硬一體優化的技術優勢,構築智慧時代的“晶片+作業系統”聯盟,掌握話語權。另外,深度學習相關人才稀缺,培養成本高,如果沒有自建生態,可能難以持續培養深度學習相關核心人才。
王海峰說,研究和發展技術領先、功能完備、自主可控的深度學習框架和平臺,對於推動中國人工智慧的技術創新、產業發展和人才培養,實現人工智慧技術和產業的自主可控,加速各行各業智慧化升級,具有至關重要的作用。
據介紹,飛槳已經在基本功能、效能、晶片支援的完備性等技術指標上與國外框架相當,在中文自然語言處理的演算法模型、大規模分散式訓練、推理引擎等技術上還領先於國外框架。
“雖然在使用者規模、社群活躍度、使用便利性方面還存在短板,但是通過發揮中國在資料和人工智慧產業應用上的優勢,中國產深度學習框架完全可以實現與國外並跑,並有能力領跑。”王海峰說。
建設開源社群的關鍵是樹立開源思維
截至今年8月,開源社群GitHub上已經彙集了4000多萬的開發者、210萬家公司和機構,擁有超過1億的程式碼庫。“在GitHub上的熱門開源專案中,人工智慧類佔了很大比例。開源開放是人工智慧領域發展的全球主要趨勢之一。”王海峰說,人工智慧的快速發展,推動開源開放生態越發繁榮;而開源開放同時也推動人工智慧快速普及,兩者相互促進。
GitHub算是一個開源社群的典範。那麼,要如何打造一個真正活躍的開源社群,補上上述所說的短板?
王海峰認為,開源社群要有活力,核心是社群對開發者要有價值;它要能提供大量有益的專案、工具和模型,併為產業創造價值,這樣一來,開發者會自發地積極貢獻自己的力量,讓社群持續繁榮。
“建設開源社群的關鍵,一是建立中國軟體行業的開源思維。”王海峰建議,可以鼓勵企業、高校和科研機構建立開源技術人才的評價和激勵機制,推動高階人才隊伍建設;支援相關企業聯合高校、科研院所等開展開源技術和應用的教師培訓;在大學的課程教育中,也培養學生的開源意識,開設中國產軟體相關課程,培養更多的基礎軟體人才。
他也呼籲加強中國自主可控開源軟體及平臺的推廣和應用,通過政策引導、設立專項等方式,鼓勵廣大開發者基於中國自主可控的開源軟體、平臺和社群進行創新。“在國家支援的重大科技和產業化專案中,也可以使用中國自主的開源軟體開展科研工作,確保底層自主可控和資訊保安。”王海峰說。