-
1 # 壹千零叄夜
-
2 # 麵條你板哥
理論的威力在於預見,在大部分大資料和商業智慧專案中,透過資料作出精準的預測都是這些專案最有魅力、同時也是最有價值的部分。
想象一下,如果我們開了一家零售店,資料能夠告訴我們明天將會來多少消費者、各種商品的銷量預計會是多少,我們是不是就可以從容地調整零售店的銷售策略,並最大化地控制庫存了?要知道,這些問題將對於零售店的利潤帶來直接的影響。
以預測分析為代表的高階分析功能也是BI的未來發展方向,Gartner 指出,高階分析利用機器學習(ML)與人工智慧改變分析內容的開發、消費與共享方式,能夠實現自動化決策或為決策提供支援。
但是,要想從紛紜複雜的資料中抽取出真正有價值的資料,並透過資料洞察將其轉換為有價值的預測,卻並不容易,建議企業分別從資料蒐集、資料處理、資料分析策略實施等幾個步驟來分別進行:
一、確定哪些資料是可用的,並蒐集資料
毫無疑問,預測分析的基礎是豐富、多維度且高質量的資料。在不同的場景中,需要蒐集的資料都是不一樣的。例如,在零售場景中,這些資料可能包括不同產品/時間/地點的銷售額組成,消費者的年齡/性別/收入分層,甚至是消費者的表情、情緒等基於計算機視覺的深度資料,這些資料越多、準確性與即時性越高,那麼就越有可能產生精準的預測結果。
而在網路分析場景中,需要蒐集的資料也遠不止簡單的頁面檢視跟蹤,還要確保儘可能多地記錄使用者行為的不同訊號。這可能意味著使用者需要測量滾動行為、影片消費、下載活動、購物或瀏覽活動、購物車進展等,有些資料需要工具的支撐,並需要得到使用者的授權。當然,這些資料越細緻,可能支撐的洞察也就越深入。
需要注意的是,在蒐集資料的過程中,一定要注意合規性的風險。GDPR以及網路安全法都已經將資料安全保障作為一個必須要遵守的嚴格規範,因此,企業在蒐集這些資料的過程中,要儘量避免額外、敏感資料的蒐集,並最好能夠取得消費者的授權。此外,還需要注意這些資料在儲存、呼叫過程中的安全性。
二、資料處理與訪問
說到資料處理,不可避免的會涉及到資料倉庫或是資料湖的使用,在之前的文章中,我們也提到了兩者應該如何構建,以及相關的問題,這裡就不再贅述。我們需要注意的是,從資料蒐集到資料處理的這個鏈路中,清除資料雜音、去掉重複或是錯誤資料對於降低資料體量,提升預測結果準確率有著至關重要的作用。
除了用於最終的自動資料預測之外,經過處理和最佳化的資料對於人工決策也有著重要意義,這就要求其對於資料訪問有著高度的友好性。
以零售店為例,這些資料應該確保使用者以近乎實時的方式瞭解庫存,包括庫存不足、商品擺放錯誤,以及貨品補充。無論是店員還是總部員工,均可輕鬆地在使用者友好型介面上對相關資訊進行檢視、管理和優先順序劃分。訪問這種動態的真實資料還有助於進行戰略規劃,以提高銷量。它支援零售機構瞭解各項決策所帶來的影響,比如改變商店佈局和客戶路徑、降低庫存商品價格,或使用數字標牌展示商店特製或通用的企業訊息宣傳標語等。
三、資料預測分析
在最終進行資料預測分析時,不同的使用者所應該採取的路徑與工具也是有著極大差異的。其中最重要的影響因素就是資料的規模以及企業的需求。
對於擁有大規模資料集的使用者來說,透過深度學習等技術來進行大資料應用是最佳的選擇。Hadoop 等大資料工具可用於並行處理大量資訊,同時為使用者提供對底層叢集資源的輕鬆透明管理,其往往支援圖形資料庫、傳輸分析、常規批處理、即席查詢和機器學習,可以透過資料建模來生成資料預測結果。
對於資料規模中等或較小的使用者來說,透過BI工具來進行預測分析是更優的選擇:雖然不少分析人員可以熟練地透過迴歸分析等技能,來進行一些形式的預測分析,但是這對於時間、成本都將是一個考驗。而Data Analytics 資料分析平臺等BI工具提供了簡單、易使用的預測分析功能,讓這個過程變得更加輕鬆。
回覆列表
這個問題有點空。
是什麼型別的企業?分析哪一個行業的資料?資料模型是什麼?你需要分析什麼樣目標?一個都沒有。
所以問題應該有針對性,不應該是假大空。