以下為演講節選:
數字經濟與資料資產
我們這個時代是一個大資料的時代。大資料是我們時代的自然資源,在人類的歷史上,從來沒有過像現在這樣用非常簡便的方法、用非常短的時間獲得大量的資料,透過不同的感測器,透過各種的資料採集,透過網際網路上自己的生活痕跡採集大量的資料,成為新的自然資源。
在這個大資料時代,我們有了一個基本的技術生態,我們有云計算,同時又有無線網、有5G,可以使每個人隨時隨地訪問到資料服務。
這個時代把資料變成資源,有了這個以後資料就變成了資產。今天又開始過渡到一個對它資本化的過程,把資料作為一種產品,作為一種可以交換的資產,就是資本,它作為新的社會發展的動力。
今天資料資產的特點,它具有個性化,每個人都是資料的生產者,正是因為這個原因,所以我們才有了資料市場的概念,才有了像GDPR這樣對於個人資產的保護這樣的一種協議,這是一個非常重要的未來前景,在資料構成的環節中,每個人都是資料生產者,也是資料資產的擁有者,怎麼界定它,怎麼保護它,是我們經濟生活中一個重要的特點。
從資料資產到資料資本有兩個重大的瓶頸,第一點是要解決資料資產的交易性和資料使用的特徵,要保證我們所形成的資料資產的產品,是可以用來交換的,這個時候就有一個非常重要的資料特點,那就是所謂的使用的非排他性,資料可以隨意複製。解決這個問題有區塊鏈的技術,區塊鏈構成資料中間,每一塊的資料資產都是不可複製的,這就是形成交易性的一個重要條件。
第二點,對於個人資料接近無限的量級,我們無法用腦力來處理我們的資料,這個時候就需要用人工智慧,人工智慧的一個重要任務就是把資料形成資料產品。
從這個意義上來講,資料經濟和社會具有整體性,這個整體性從資料資源到資料資產,我們運用了區塊鏈這樣一種新的資料互聯的結構,還有一個從資料資產到資料生產力,我們採用的是人工智慧這樣的一個生產工具。這兩個組合起來就是一個數據社會。那麼基於這個社會的一個基礎,對其經濟學的研究就是數字經濟學。
我們可以回顧一下資料經濟生態系統的演變,可以看到,從過去資料是零散的,每個人不規則地管理它,到了2010年之後出現了雲計算,就出現了資料管理者的概念。我們可以託管資料,就像銀行管理著我們的金錢,我們有一個數據中心或者雲計算中心管理著我們的資料。那麼有了管理資料以後,資料的擁有者跟管理者之間就有一個非常重要的關係,這個關係是什麼?這個關係就是資產管理。資料管理者必須保證其管理的資料在使用時,能夠保證資料擁有者的私密性、資料的擁有權、資料的控制權,這就引出了資料資產管理的概念,這在2010年以後到今天,都是一個最熱門的題目。
那麼,形成了這樣的資產管理以後,交換交易怎麼樣形成資料產品,這就是區塊鏈的一個重要特徵。同時,另一個重要的認識是我們今天所謂的大資料,即資料科學,就是透過資料來認識世界的科學。
資料科學與人工智慧
總結一下,我們認為資料是世界新的市場資源,我們不斷利用和創造這樣的資源,這種資產或者資本化是資料科學一個重要的研究。
資料科學還有一個重要的任務,透過資料來認識世界,怎麼認識?它的認識是從觀察來總結觀察到的事實,總結的過程是基於統計的推演,推演的結果就是我們所說的模型,推演的過程不是人來做而是自動化,那就是機器學習、人工智慧。我們將會有越來越多的資料,越來越強的推理,越來越自動的學習,越來越深的理解,這就是我們的未來。
以上就引出了人工智慧的發展。所謂的人工智慧是資料科學的一個基本技術,我們可以這樣來簡單的看一下人工智慧的特徵。我們有世界,有一個認知體,這個認知體可以是人也可以是機器,總的來說是一個認知。我們人在做認知或者機器做認知的時候要做總結,總結出來就是模型,模型存在我們的思維體中,在腦中的儲存的模型不斷地對這個世界做出判斷,或者叫預測,這樣的預測和觀察就一定會形成對比,一個是主觀的認識,一個是客觀的觀察。這個時候如果說我們把觀察和自己主觀的意識做一個比較,這中間會有一些差異,如果沒有差異就很好,因為我們的認識得到了實際的檢驗,這使我們的認識更加有信心;如果觀察和認識有不同的話,那麼這時候就會出現兩個結果,一個是我們相信自己的觀察,相信世界的客觀性,這個時候怎麼辦?就改變我腦中的模型,這就是一個學習的過程;還有一種人比較自信,相信自己的認知,認為自己是對的,這個世界是錯的,那就會出現改變世界,出現一個行為。人類整個的認識過程基本上就這兩類。
在過去,當資料量比較少,計算率比較差的時候,機器人的知識獲得,是透過人把自己的知識總結出一條一條的規律,來告訴機器人,這是硬的輸入。後來隨著資料量的增長,計算能力的提高,我們才有了基於統計的學習,最後到今天的深度學習。總而言之,我們的資訊量越來越大,計算能力越來越強,導致了我們知識獲取能力、自動獲取能力發生了變化。
人工智慧有很多的研究,下面講一講它的應用。今天很多所謂的智慧,智慧銀行也好,智慧城市也好,智慧車也好,講的都是給今天所生活的每一個社會體賦予一種人工智慧推理的能力。這裡有很多的例子,中間一個比較重要的例子就是智慧金融,這裡面有很多很多的應用,根據我自己的一些實踐,再稍微舉一些例子。
人工智慧與金融產業升級
一個是金融服務的精細化,很大的一個改變,透過資料可以感知整個金融界,跟你的金融產品的效能和市場表現,還有客戶的洞察,這些都可以使得金融機構構造一個以客戶為導向的,有精確營銷的高效能服務,這是人工智慧的一個很重要的應用。現在講的普惠金融,很大程度上就是細分,什麼叫普惠?就是把金融落實到個人身上,未來的狀態就是這樣的,精細化的金融服務,強呼叫戶體驗,強呼叫戶的個性需求。
在金融服務鏈方面,整體上來說它有一個很重要的資料驅動的資料鏈,我們從產品競爭力到員工激勵,到營銷系統、管理,一直到客戶的管理系統,這些都是透過資料來服務的,來看顧客的忠誠度,來看產品的易化程度,這裡面都離不開大資料。
講到這個問題,產品怎麼設計?產品設計的未來總是一個特點,就是長尾效應,更多的個性化,更多的照顧每一個人,這個時候我們要研究產品的分佈,要研究區域的競爭力,還有就是它的時效和整個生命週期中間不同的社會情況,不同的經濟情況對它的影響,它的抗災性等等,都是一種非常重要的資料驅動的做法。
把握資金流動的特徵,特別是在信用打分的時候是非常重要的。前面講的很多的消費信貸產品,面向個人的系統,這裡面很重要的一點就是對個人償還能力的評分,這個評分裡面有各種對你資金流動的理財愛好、風險偏好等等的特殊描述,這也就決定了個人的信用。
還有很重要的一點,就是要揭示金融世界中的內在關係,一個股票的增長和它的變化以及其他的金融產品的變化,跟一些因素相關,把它們之間的因果關係揭示出來,是非常重要的,那麼這一句話怎麼解釋我們所能看到的一些資料,就是一些持續資料,比方說股票的波動,那麼我們怎麼樣透過這些波動來推導這些系統中間各元素之間的關係,這是一個非常重要的因果分析的關係,也是機器學習和人工智慧中間的一個難點。
金融監管與人工智慧產品化
最近談到最多的話題之一是大資料風控和監管。大資料風控,它的特點是將風險控制落實到微觀個體,而監管的特點是透過政策來宏觀控制風險,這兩者之間的平衡實際上在相當長的一段時間裡都是我們將要討論的重點,它們兩個是沒有矛盾的,相輔相成,但是現在看來更多好像是一種矛盾。
長遠看來,監管需要更多的精細化,大資料風控必須要有一定的宏觀政策保證,這兩個是相輔相成的體系,這是一個很重要的研究領域,銀行在最近的風波中間應該得到一個啟示,要真正認真地研究資料風控與監管之間的關係。
最後,對於人工智慧的研究,現在要做的是把它賦能工業化,產品化。這個所謂的工業化是什麼?它是標準化、元件化、流程化、社會化,我們要把人工智慧很重要的各種功能作為達成人工智慧的元件,這方面我們有很多的經驗,我自己也做過這方面很多的工作。
工業化應用開發平臺的構造,這裡面不僅有模型的構造,有模擬分析器,還有一個很重要的特點就是模型管理,我們會生產出越來越多的知識分析模型,這些模型我們必須把它管理好,管理是我們對於一個企業知識的管理,這將會是人工智慧發展工業化最重要的一個瓶頸,將來我們有很多的工作要去做。
最後總結一下,今天人工智慧給金融的智慧化提供了非常好的技術,現在要做的是踏踏實實把這個技術用好。我們對於人工智慧很多的研究,沒有必要去做太多的哲學問題上的考慮,比如AI會不會超過人的智慧等等,更重要的是要考慮怎麼樣在今天各種社會生活中間把該技術用好,使得它為我們服務。那麼,金融產業當中人工智慧大有用處,希望江蘇在這方面能夠走得早,走得好,走得踏實。也希望我在和蘇寧銀行的合作期間,能夠為江蘇省金融產業的發展做出自己的貢獻。