“人類正在經歷一場前所未有的數字化革命,科學資料的豐富度、關聯性與開放性,將成為21世紀驅動科技創新的核心要素。”近日,在北京召開的國際資料委員會(CODATA)2019年學術大會上,中國科學院副院長、中國科學院大學校長李樹深院士認為,繼“觀察實驗”“理論分析”“計算模擬”之後,“大資料驅動科學發現”已成為科學研究的第四正規化。
但在現實世界中,科學資料的發展也面臨著機遇和挑戰並存的局面。“海量且多樣化的科學資料不斷產生,大家卻沒有足夠的系統去儲存或者處理,80%有價值的資料都在兩年之後就浪費了。”國際資料委員會主席Barend Mons認為,過去的一些系統和方法已經不適用於當下的大資料時代,機器的智慧化處理和使用資料的能力亟待提升。
“的確,在推動科學資料管理和開放共享工作向縱深發展的過程中,我們也發現還有許多政策問題需要探索。”國家科技基礎條件平臺中心主任蘇靖坦言,如何真正實現科學資料可發現、可訪問、可互操作和可重用?如何通過建立通用互認的科學資料標識體系來保障資料智慧財產權?如何進一步使科學資料的全生命週期和統一的技術標準更加完善?如何有效推動科學資料的開放和傳播,同時保障資料的安全?如何使科學資料的應用成為解決複雜問題、推動科技創新的真正驅動力?等等。“這些問題的探討和解決正逐步提上議程,中國也正在成為國際上推動科學資料資源建設與發展的重要參與者。”
去年,國務院辦公廳正式釋出《科學資料管理辦法》,並啟動了國家科學資料中心的部署和建設工作。時隔一年,科技部和有關部門立足前期工作基礎,在高能物理、基因組、氣象、地震、海洋等領域組建了20個國家科學資料中心。這些中心將成為中國科學資料管理和開放共享方面重要的基礎設施和載體。
對於國家層面出臺的第一個科學資料領域的管理辦法,中科院院士郭華東表示,這使得科學資料的管理和使用有了可遵循的章程和依據,也使得科學資料的開放共享在科學界達成共識。但他同時也提出:“在《辦法》推進的過程中還需要著力解決資料權益保障等一系列問題,才能使辦法真正落實落地。”
CODATA中委會副主席、中國科學院計算機網路資訊中心主任廖方宇進一步解釋說,站在科學家個人的角度來講,存在一個科研競爭的壓力問題,有的人很難得到科研資料,但有的人有了科研資料卻不一定能產生很好的結果,如何來平衡評價?應該出臺什麼樣的激勵機制?另一方面,從國家的利益考慮,在國外核心期刊發表論文,科研資料提交到指定的儲存機構,有時候就必然面臨資料流失、智慧財產權得不到保護的問題。
而國家基礎學科公共科學資料中心主任胡良霖最關心的則是資料品質的問題,哪些資料需要儲存?該如何儲存?比如,一些資料在最初採集的時候成本比較大,經過幾年採集技術的快速發展,成本已經大大降低,而長期使用的儲存介質的費用遠高於最新採集的成本,要不要把歷史上存留的這麼多資料都儲存下來?他建議,中國急需建立自主可控的國際級權威資料庫,推動科學資料的分級儲存,並且對儲存的資料做出明確分級指導和界定。
會上,一些與會專家也呼籲,國際資料同樣需要在全球開放共享。“多國科學家貢獻科學資料共同建設的資料庫,應當在貢獻者所在國提供映象服務,以保證各貢獻國對資料的平等獲取權;對於國際期刊發表論文要求提交資料,期刊應當與論文作者所在國聯合確定論文關聯資料的儲存機構,首選在其所在國的優質資料儲存機構。”專家們說。
蘇靖表示,希望國家科學資料中心能夠很好地承擔起科學資料管理和開放共享的功能,支撐更多具有世界領先水平的重大科學發現和原創性的技術突破,推動科技創新能力提升和經濟社會發展。