首頁>科技>

大資料的真正價值在於如何合法地充分應用,資料開放和資料共享成為大資料的關鍵因素。《開放資料憲章》將開放資料定義為具備必要的技術和法律特性,從而能被任何人在任何時間和任何地點進行自由使用、再利用和分發的電子資料。其定義突出強調了開放資料的兩個核心因數,一是資料,是指原始的、未經處理並允許個人和企業自由利用的資料,在科學研究領域它也指代原始的、未經處理的科學資料。二是開放,開放一般來說可以從兩個層面上來定義,即技術上的開放和法律上的開放。

近些年來,全球各國紛紛將資料開放納入到國家發展戰略。美國政府最先對大資料革命做出戰略反應的。2009年,美國聯邦政府釋出《開放政府指令》,作為大資料的前奏推出了“Data.gov”公共資料開放網站。2012年3月,美國聯邦政府釋出了《大資料研究和發展計劃》,正式啟動了“大資料發展計劃”,宣佈將投入超過2億美元在大資料研究上;同年5月,聯邦政府釋出《數字政府戰略》(Digital Government Strategy),致力於為公眾提供更好的“數字化”服務,圍繞資料進行的一系列措施在美國政府全面推進,大資料對美國政府的影響逐步顯現。我國於2004年釋出了《2004-2010國家科技基礎條件平臺建設綱要》,啟動了國家科技基礎條件平臺建設專項,完成基礎資源的整合。以資源共享為核心,開展科技資源的開放共享和利用。2009年我國的科學技術網站——中國科技資源共享網正式開通。

2007年12月,在蒂姆·奧萊理的召集下,建立TrackGov.us的陶伯拉和其他29名開放公共資料的推動者共聚奧萊理出版社的加州總部。透過兩天的會議,他們制定釋出了開放公共資料的8條標準和原則。

1.資料必須是完整的。除非涉及國家安全、商業機密、個人隱私或者其它特別限制,所有資料都應開放。

2.資料必須是原始的。即是從資料來源頭採集的原始資料,而不是被加工修改過的資料。

3.資料必須是及時的。應當在第一時間更新資料。

4.資料必須是可讀取的。即資料可被讀取,並儘可能地擴大使用者範圍和利用種類。

5.資料必須是機器可處理的。

6.資料的獲取必須是無歧視的。資料對所有人平等開放,不需要特別的手續。

7.資料格式必須是通用非專有的。即資料格式不能獨家控制,不得排除他人對資料的使用權。

8.資料必須是不需要許可證的。即除非特定,資料使用不受約束。

奧萊理在會上感嘆說:“我們正在進入一個新的世界,在這裡,資料可能比軟體還要重要。”

我國也將政府資料開放提升到“國家戰略”地位,在《促進大資料發展行動綱要》中明確提出“推動政府資料開放共享”整體要求,明確政務資訊應“以共享為原則,不共享為例外”,將“形成公共資料資源合理適度開放共享的法規制度和政策體系”作為中長期目標。《政府資料開放準備度報告》從政策法規保障度、政策宣傳引導度、學術理論支援度、資料人才輸送度、社會輿論沸騰度、公眾認知敏銳度等六個維度來評價當前政府資料開放的“基礎土壤”。目前有31省份至2014年至今出臺231份提及“政府資料開放”的政策檔案。2018年之後,資料開放政策整體走向精細化,個別地區針對政府資料開放已制定詳細的目標規劃。截止2019上半年,已有上海、浙江等十餘個升級政府資料開放平臺搭建完成。

資料開放與共享的實施既是一個技術過程又是一個管理過程。技術過程是指採集用什麼資料格式來發布,如何定義資料訪問介面和跟新策略等涉及資料處理方面的問題。而管理過程則是指釋出什麼樣的資料,採用什麼樣的開放許可協議等等。因此,一般建議資料的釋出者應該遵循資料開放與共享原則和標準,按照平臺的具體要求,進行資料的釋出和開放共享。目前一般來說,資料開放與共享實施涉及三個主要的步驟,既資料集選擇、開放許可協議和資料集的發現與獲取。

資料集選擇

選取將要開放的資料集是資料開放與共享的第一步,但在資料開放與共享實施過程中確實工作量最大的一步。如果涉及到政府資料或者個人資料,需要資料的釋出者事先制定資料開放的標準以及對資料進行分級處理。

開放許可協議

在全球的各個國家法律體系下,智慧財產權法通常都限制第三方在沒有被許可授權的情況下對資料進行使用加工。因此,在選擇好待發布的資料集後,應該考慮對這些資料集應用什麼樣的許可協議。

資料發現與獲取

選擇好資料開放協議後,資料釋出者可將資料集釋出到相應的資料開放與共享平臺。資料開放的目的是資料的再利用,因此資料釋出者應當保證資料是可訪問可獲取的,且能提供機器能夠訪問的檔案格式。

作為科研活動的基礎性戰略資源,科學資料開放共享意義重大。科學資料“多跑路”,科研人員就能“少跑腿”,提升科技創新效率和水平。近年來,我國科學資料呈現井噴式增長。作為基礎性戰略資源,科研活動離不開資料,要提升資料使用價值,開放與共享尤為重要。同時也要注意到,開放共享的前提是充分保障資料的安全,特別是對於涉及國家安全和秘密的科學資料,更要把握好開放與保密的關係,要重視強化國家關鍵資料資源保護能力,增強資料安全預警和溯源能力。

11
  • 整治雙十一購物亂象,國家再次出手!該跟這些套路說再見了
  • 頭騰大戰又來了,我們作為使用者到底有沒有影響?