資訊預警的作用是監控市場突發訊息,定位訊息的影響範圍,及時向持倉物件發出風險提示,近年來資訊預警在證券投資和風控中有廣泛的應用。以往的預警應用關注焦點侷限、資訊收整合本高、分析效率低。基於知識圖譜技術的預警,則可以定位事件影響範圍和影響程度,輔助提升風控事件分析效率。本文以廣發證券資訊預警落地實踐為案例,通過分析各個模組的設計思路,闡述了知識圖譜在證券行業資訊預警的落地模式。
輿情預警在證券行業的應用證券行業近年來出現了不少預警的應用,根據市場的資訊對特定標的持倉的客戶發出訊號、針對特徵資料的異常對交易行為進行攔截、基於輿情和一致性預期的變化對投資頭寸進行管理等。輿情預警的核心模式是“監控-分析影響-輸出結論”,即通過對條件進行分析後,輸出是否需要觸發某種措施的過程。
落實到具體的預警功能,需要結合金融和行業領域知識和人工智慧,構建業務模型,形成指標預警、業務預警、模型預警等應用,按照複雜程度來看,又可以分為以下應用型別:
1.閾值或波動率預警。選定重點標的和關注的資料指標,根據歷史資料集,選擇使用的演算法訓練屬性資料波動率模型,如果標的最新屬性數值的變動超過波動率模型的範圍,發出報警。
2.事件預警。市場產生突發或非突發訊息時,涉及某個市場中的特定主體,可利用語義分析或金融知識,判定該訊息對主體為正面或負面,如負面程度較高(將影響主體金融資產/負債的價格,或影響主體關聯個體的金融資產/負債價格),則對持有該主體及關聯個體金融資產/負債的客戶,發出風險提示。
突發事件不僅對事件主體有影響,也會影響與事件主體有特定關聯的主體。利用知識圖譜,監控輿情事件,定位事件效應的影響範圍,儘早預警風險事件發生,能一定程度降低損失。知識圖譜最大的價值在於關係的發現,即在已有知識的基礎上,通過合適的推理和判斷方法,找到實體之間的關係。證券市場主要圍繞市場主體的關聯和市場行為建立聯絡,證券知識圖譜一般以市場主體為實體,建立起市場主體之間關聯的關係網路。因此,證券知識圖譜可支援知識圖譜內的實體及其關聯、關係傳導的檢索,監測知識圖譜實體和關係異動,定位事件影響範圍和影響程度,輔助風險事件分析效率。
基於知識圖譜的持倉預警廣發證券的持倉預警實踐主要以A股上市公司為主體,基於廣發智慧化基礎能力衍生出來的實踐產品。預警的原始輸入為A股公司的事件或資訊,通過語義分析識別資訊所指的實體和情緒正負面,由知識圖譜判斷該實體以及產業鏈上下游關聯實體等,結合推送邏輯計算,最終由應用發出持倉預警提示,簡要邏輯設計如圖所示。
圖 持倉預警應用流程圖
根據該邏輯,建立事件驅動的持倉預警框架,主要由3個核心功能模組構成:語義引擎、知識圖譜、預警邏輯。
1.語義引擎。語義引擎作為整個預警鏈路的輸入源頭,是非常關鍵的環節。語義引擎首先將資訊這類非結構化資料提煉成後續流程依賴的結構化資料,包括事件型別、焦點實體、正負面評價等。支援的事件型別包括新聞類、公告類和研報類。
本專案針對金融資訊的特點,在語義情感分析上做了一些優化。首先訓練語料採用的是領域內資訊資料,通過整合內部和第三方供應商以及主流財經網站的資訊資料,組成龐大的專用訓練資料集;其次,在特徵提取方面,加入了卡方檢驗優化,增強了特徵提取的有效性;最後,情感分數的計算使用的是SVM演算法,基於概率的方式來訓練分類器。
2.知識圖譜。事件的影響具有擴散效應,而擴散的路徑需要藉助企業知識圖譜進行快速查詢。所以接下來,由語義引擎獲取到實體資訊傳遞給知識圖譜並進行唯一定位後,便能知道事件的擴散範圍。
針對本專案應用的特點,知識圖譜的重點是要檢索出事件與標的之間的關係,對於不同的實體的型別,分別有不同的檢索方式:
(1)上市公司:檢索該公司及其2度關係內公司發行的金融產品。
(2)行業:檢索出2度關係內公司實體發行的金融產品。
(3)實體產品:檢索出對應的發行公司的所有發行的金融產品。
(4)自然人:檢索出自然人2度關係內的公司實體發行的金融產品。
根據不同的實體,最終得出了2度關係以內關聯的金融產品,及其公司間的關係型別,這些資料是預警邏輯依賴的基礎。
不同的事件方向對主體的影響不同。對於關聯的範圍,最好以業務專家經驗作為先驗知識,下列出業務專家歸納的主體關聯會受影響的規則:
●主體的債權人
●主體的擔保人
●主體的控參股大股東
●主體的主要客戶或供應商
3.預警邏輯。由前序流程得到的資訊正負面評價及其關聯資訊,並不會直接推送至目標客戶。客戶並不希望收到頻繁的預警通知,而是需要有指導價值的資訊,所以抽取資訊是預警邏輯的首要任務,同時使用者可在預警邏輯定義推送業務邏輯,當資訊與標的之間的關係符合推送條件時,即推送至持倉、自選股持有該股票的使用者。
推送條件的定義依賴建模,以此來分析影響程度、定義預警閾值等。建模可以基於概率模型,建立歷史事件與關聯主體股價的回測模型,可以基於專家經驗,即從業務角度判斷事件對關聯公司的影響程度,也可以是二者結合。
廣發持倉預警應用在當前的應用階段,主要基於業務專家的經驗規則。基於經驗規則主要考慮事件的影響程度和主體間的關係型別,具體的要素包括:資訊中的正負面、資訊中事件的類別、客戶持倉、主體與關聯主體的關係型別和距離,其中關係型別涵蓋債務、擔保、訴訟、控參股、客戶、供應商關係等。計算公式如下:
其中,NR表示資訊事件正負面係數,Wrt表示關係型別係數,D表示關係度數,Wnt表示資訊型別係數,P是客戶持倉比例。如果S值大於某個經驗值範圍,則認為應該向該客戶推送當前資訊及其對客戶指定持倉的影響路徑和程度。
該模型適用於大部分的資訊場景,部分特殊資訊事件會對與事件主體有特定的關係的主體造成較大的影響,而對非該特定關係的主體傳遞影響較小,這會與通用模型的計算結果不匹配。因此需要將這部分事件抽取出來,對事件型別、影響主體的關係型別、以及對應的重要性係數等因素單獨進行定義,利用語義分析的方式進行區分,當符合特殊事件定義時,即採用另外的事件模型進行計算。
本文以使用者持倉預警為例,介紹了基於知識圖譜的智慧預警應用和及其建設方法。應用的落地,既要參考行業的嘗試、考量業務線條的具體應用需求,又要從整體資源和知識圖譜的特點和本質出發,力求在兩個方向上得到契合,這樣才能讓知識圖譜的落地有統一的規劃,各方向的應用能夠形成合力。