回覆列表
  • 1 # cnBeta

    對於想要構建新功能和更好地開展創新的開發者與工程師們來說,資料有著極高的價值。

    然而現實是,這些資料通常高度敏感且無法訪問,在合規性和鎖定狀態的處理上也相當麻煩。

    好訊息是,大約半年前,由前美國國家安全域性(NSA)和亞馬遜工程師組建的一支團隊,就已經在致力於打造一個“適用於資料託管的 GitHub 平臺”了。

    據悉,前 NSA 和亞馬遜工程師們創立了一家名叫 Gretel 的初創企業,旨在幫助開發者對敏感資料展開實時、安全地共享。

    聯合創始人之一的 Alex Watson(其他創始人包括 John Myers、Ali Golshan 和 Laszlo Bock)描繪了一個常見的問題:

    通常情況下,開發者無需訪問資料庫的完整許可權,而是隻請求一部分或某個特定的示例。然而在用於酷炫的案例之前,平臺首先得確保資料能夠被安全地共享。

    好訊息是,以 GitHub 為代表的企業,已經證實了此類原始碼分享平臺的廣闊前景、且有助於簡化程式碼的訪問和協作。目前他們缺少的,只是與 GitHub 體量相當的資料。

    Alex Watson 補充道:“外媒當前正在開發的軟體,已允許開發者自動檢出資料集的匿名版本”。

    這種所謂的‘合成數據’,實質上是人造出來的。其外觀和工作方式,有些類似於常規的敏感使用者資料。

    Gretel 使用機器學習對資料進行分類(如名稱、地址和其它客戶識別符號),併為資料分配儘可能多的型別標籤。

    一旦該資料被標記,即可應用訪問策略。然後藉助匿名處理大量資料的差異化隱私技術,使之不再與客戶資訊捆綁到一起。

    顯然,這種藉助機器學習生成的完全人造的資料集,已經引起了業內的廣泛關注。此外值得一提的是,Gretel 計劃採用與亞馬遜雲服務類似的按需收費政策。

    目前這家初創企業已經拿到由 Greylock Partners 牽頭的 350 萬美元種子輪資金,其它投資者包括 Moonshots Capital、Village Global 和幾位天使投資人。

  • 中秋節和大豐收的關聯?
  • 把下面的詩句的補充完整?