我們早期幫助他們(曠視)尋找了合作伙伴,包括美圖、螞蟻金服,讓他們拿到了大量的人臉資料。
禍從口出。9 月 12 日,HICOOL 全球創業者峰會上,李開復的這句「無心之談」像是一顆雷,炸開了 AI 隱私安全的馬蜂窩。
牽連進來的兩家公司,一個是國內最大的人臉識別技術服務商,一個是國民級金融資料平臺,坐擁 10 億使用者,掌握著你「從襁褓到墳墓」的幾乎全部人生資訊。
我猜,李開復本意是想以曠視為例,介紹創新工場對創業公司的扶植,但無心插柳,這番關於使用者隱私的「夢幻聯動」一出口,濃重的火藥味立刻驚動了各方公關。
隨後,各方出面「否認三連」。螞蟻集團:未與李開復先生有過接觸;曠視:我們不掌握個人資訊;李開復:口誤,深感歉意。
在螞蟻集團的宣告中,有這樣一句話值得注意:
雙方過往合作僅限曠視科技授權其影象識別演算法能力給螞蟻單獨部署和使用,不涉及任何資料的共享和傳輸。
有專業人士指出,所謂「單獨部署」在技術上可行,也是行業實踐中的常規操作。
一般而言,演算法公司會提供一個介面,只要呼叫介面就能訓練演算法模型。在這個例子中,曠視有可能就是將介面給到螞蟻,螞蟻在自己的伺服器上訓練模型,這樣一來,曠視無法接觸到使用者的直接隱私,身份資訊被洩露的可能性相對較小。
但顯然,這個解釋很難讓廣大網友信服。畢竟螞蟻和曠視深厚的淵源之下,「共享資料」這件事看起來理所當然。
資本上,阿里是曠視科技的最大股東。根據曠視科技此前計劃在港股上市時的招股書,螞蟻金服直接持股 15.08%,此外,通過淘寶中國間接持股 14.33%,兩者相加,阿里系合計佔有曠視近 30% 的股份。
業務上,雙方捆綁也非常緊密,目前支付寶刷臉支付的技術方案正是由曠視科技提供。
四個字,意味深長。
有多少種方法「賣」掉你的臉?不管這場「人臉資料羅生門」中誰是誰非,也不管你願不願意接受,我們都在加速進入一個「生物特徵識別」的年代。
指紋解鎖、刷臉支付、聲紋密碼、虹膜識別……這些人工智慧演算法的工具,正在逐步替代傳統密碼,成為我們在現代社會中的通行證。
而基於機器學習的生物識別技術,有一個特性:它需要資料來「喂」。「喂」得越多,「喂」得品質越高,演算法才能跑得越精準。機器學習界有一句很出名的話:資料和特徵決定了機器學習的上限,而模型和演算法只是逼近這個上限而已。
近年來,在人工智慧公司數量大爆發,各家對資料的爭奪自然愈演愈烈,人臉資料價格也水漲船高。曾有人臉識別演算法工程師透露,收集 3D 人臉資料的成本,一天就會花掉幾十萬。
為了獲取資料,資料標註公司可謂花樣頻出。
比如,《財經》就曾報道,一些公司會打著「檯燈測試」幌子,要求兼職人員配合擺出各種姿勢,用隱藏的攝像頭拍下來。兼職人員在完全不知情的情況下,就將自己的「臉」完整交給了攝像頭。
成本壓力之下,一些 AI 初創公司也不得不邁向灰色地帶。
你發在微博上的美照,逃不過爬蟲的抓取;各類 APP 打著「變臉」、「算命」的旗號,瘋狂收集人臉資訊,這些資料存在後臺或者雲端,最終的去處往往都是各類「資料黑市」;即便公共場所的人臉識別也不見得 100% 安全,這些相對「粗糙」的資料,雖然不能用來訓練演算法,但卻能拿來驗證演算法。
即便不主動「出賣」,你也很難保證自己交給 APP 的資訊,不會因安全漏洞而被動洩露。
去年 2 月,一家深圳 AI 公司被爆發發生資料洩露事件,超過250萬人的核心資料可被獲取,680萬條記錄洩露,其中包括身份證資訊,人臉識別影象及GPS位置記錄等。
關於「隱私安全」的討論早就是老生常談。如果說幾年前,我們還在為個人隱私流失而感到擔憂,那麼現在,似乎絕大部分人都已經接受自己在大資料時代的新屬性——「工具人」。底線一降再降,保護隱私什麼的,那是奢望。只要別把潛規則翻到明面上,大資料的「吃相別太難看」,大家就能相安無事。
一個最明顯的例子,是網際網路上對「隱私交換便利」這一論調的態度變化。從一開始的出離憤怒,逐漸變得麻木。在沒有其他選擇之下,一些聲音開始呼籲大家「理性討論」。
可問題在於,我們擁有不用隱私交換便利的權利嗎?
我們還有選擇嗎?幾年前,李開復預言中國將在 AI 時代超越美國,當時他給出的理由中,除了基礎設施、人才培養之外,還有一個重要原因——他認為中中國人對隱私的「開放態度」,將驅動中國 AI 技術快速發展。
用李開復的話說,「如果資料是新時代的石油,那麼中國就是新時代的沙烏地阿拉伯」。
聽起來頗為諷刺,但這的確是 AI 產業的現實矛盾——公開資料庫永遠「喂不飽」一個完美的演算法,來自「Sunny」下的資料又相當有限。
這也不是哪一國的問題。
在隱私意識相對更強的美國,我們看到的是 IBM、Google 等公司,它們迫於抗議和輿論壓力,相繼宣佈停止人臉識別業務。而在不被關注的角落,也有諸如 Palantir 等一類資料分析公司,通過強大的資料探勘能力,讓你在演算法面前「一絲不掛」。
針對刷臉支付,監管部門也在加快頂層設計。去年,中中國人民銀行印發《金融科技(FinTech)發展規劃》,對隱私計算、資料標籤、模式識別等技術做出規定。
但法律相對技術的滯後性,決定了我們還要在灰色地帶摸索相當一段時間。
我們之所以焦慮,是因為在大資料時代,人臉、指紋、聲紋等不再是個人識別資訊這麼簡單,它們與我們的銀行賬戶、通訊郵箱、社會身份掛鉤,成為一種價值更加多元的特殊「資產」。
在這場產業變革的滾滾大潮中,相對於巨頭公司,個人永遠是弱勢的一方,我們卸不掉支付寶,也躲不過那些沒必要的人臉識別,唯一能拿起來的只有「信任」這張選票。
前不久,「國內人臉識別第一案」開庭。一位大學教授因拒絕刷臉入院,被取消了年卡會員資格,此後教授將動物園告上法庭。
在法律落地、產業洗牌之前,這一樁訴訟可能改變不了什麼,但至少這是一個開始,我們期待一個「隱私與便利可兼得」的時代。