2019年以來,深水集團、杭州水務集團、重慶水務集團、蘇州水務集團、鄭州供水等眾多大、中型水務企業相繼啟動了資料治理和大資料中心建設專案,水務行業如此密集地開展資料治理和資料中心建設,智慧水務的建設重心逐步發展變化:由建設營收、GIS、SCADA等MIS系統為主的業務資料化,逐步轉變至以資料治理和大資料為主的資料業務化;由偏向於資料的生產轉為更注重資料資源的管理和資料資產化,水務行業數字化轉型迎來新的發展階段。
圖1 資料治理及大資料中心建設是熱點
在資料倉庫建設過程中,各水務企業資料倉庫建設流程也會有所區別,但主要流程和重點環節基本一致,主要流程和重點環節介紹如下:
圖3 資料入倉流程圖
一、元資料採集:制定出各資訊化系統的元資料清單
根據前期的需求調研,確定本次入倉的資訊化系統,並向系統維護人員收集系統操作手冊、資料字典等文件以及系統資料庫相關資訊。透過資料採集工具對各系統資料庫的表和欄位進行採集,結合各系統文件,確定資料庫中所有表和欄位的中文含義及欄位的資料型別,形成元資料清單。
以營銷管理系統資料入倉為例,需要明確哪張表是客戶表,哪張是收費表,以及表中每個欄位的中文含義。有些系統文件由於沒有及時更新,與現有系統資料有不一致情況,則需要資訊管理部門與系統開發廠家支援,獲取比較準確的元資料清單。
圖4 資料採集範圍
二、資料篩選:在元資料清單基礎上篩選出需要入倉的資料,制定入倉清單
針對元資料清單進行進一步的資料篩選,去除臨時表和空表等無用表,確定核心資料表和維度表,提供給資訊管理部門進行確認,形成最終入倉的資料表清單。
經過第一步元資料採集,形成元資料清單的過程,可以比較容易的識別出臨時表和空表,重點放在空表是否確實為無用表上即可。
三、資料入倉:根據各資料表實際情況,制定出入倉方案,透過專用ETL工具將資料抽取至映象資料倉庫
根據待入倉的資料表清單,以及每張表的實際情況,制定出源資料和映象資料倉庫表之間的欄位的對映關係,確定出每張表的入倉策略和抽取規則,是實時抽取還是定時抽取,是全量出抽取還是增量抽取,將規則配置入ETL工具,執行資料入倉。
將資料匯入映象資料倉庫時,因為資料通常來自多個系統多個數據庫最終進入同一倉庫中,映象資料倉庫對於資料表的命名有專門的原則和規範,與源資料庫的表名會有所不同,需要將表名之間的對映關係做好記錄,同時制定好每張表的同步規則,如考慮業務系統晚上使用較少,資料同步時間一般放在晚上,錯峰同步;
以營銷管理系統為例,系統中的組織機構表、客戶表等資料不多、變化較小的表可以全量同步,而像抄表資料、收費資料等資料量較大的表可以使用增量同步。
四、資料質量檢查:制定資料質量檢查規則,定時進行資料質量檢核,提升企業資料質量
根據元資料清單以及業務含義,定義出資料質量檢查規範、評分標準、及每個欄位檢查規則,如戶號是否唯一,手機號是否為11位數字,身份證號是否為國家規定的15位和18位規則,抄表讀數是否為合理的數字範圍等。
經過資料質量檢核清洗,形成資料質量報告,並將報告結果和未透過檢核的明細記錄反饋至源系統,形成閉環,PDCA持續提升源資料庫的資料質量。透過資料質量檢核的資料,進入標準化資料倉庫,供主資料管理和資料集市使用。
五、建立資料集市:從業務角度對入倉資料進行梳理,制定資料資產目錄以及主資料和業務模型等資料標準,最終形成資料集市
對資料入倉清單進行專題資料識別,劃分資料分類與主題,形成資料資產目錄,制定出主資料和業務模型等相關資料標準。
制定資料資產目錄主要是為了讓非技術人員瞭解企業有哪些資料,因此在制定過程中一般從業務角度進行分類制定,方便業務人員理解。制定資料標準時,一方面需要考慮與現有系統的相容性,另一方面應重點考慮未來的擴充套件性和統一性,方便企業對資料的應用,也為新系統建設提供指導。
六、資料應用:建設資料倉庫最終是為了更好的應用資料,充分發揮資料在生產運營、營銷客服、管理管控中的最大價值。
透過資料倉庫,水務企業可以拆掉“煙囪”,打破各系統中的資料壁壘,實現真正全面資料共享,同時也讓水務企業的分析統計維度獲得全面的提高,為企業管理帶來新的視角和手段。
資料共享不僅讓水務企業內部與外部、部門與部門間的資料獲取與共享更方便更快速,也讓每一位員工能夠獲取更全面的資訊,提高工作效率,如客服人員不再只能查詢營銷管理系統內的使用者資訊,還能知道使用者所屬的二次加壓泵房的工作狀態、最近一次水箱清洗的時間、最近一次水質檢查結果、附近管網情況、是否有搶修停水情況發生、當天附近是否還有其他使用者來電反應相同事件、用水由哪幾個水廠提供、附近是否有工作人員可以快速上門、用水由哪幾個水廠提供等,真正實現從水源到龍頭的管理。
同時透過基於AI演算法的客戶畫像功能,可以識別出更多客戶特徵,方便業務人員為客戶提供更為精細化有針對性的服務,如獨居老人關懷、重點使用者識別、異常用水分析、工作質量分析、客戶服務分析等,支撐精準服務、個性化和主動服務,持續提升客戶體驗和獲得感。
隨著《關於加快推進國有企業數字化轉型工作的通知》、《關於加快構建全國一體化大資料中心協同創新體系的指導意見》等眾多利好政策的推出,資料作為重要的生產要素將逐步成為水務企業的經營理念——憑資料工作、憑資料決策、憑資料指揮。