常用的資料分析方法有5種。
1.對比分析法對比分析法指透過指標的對比來反映事物數量上的變化,屬於統計分析中常用的方法。常見的對比有橫向對比和縱向對比。
橫向對比指的是不同事物在固定時間上的對比,例如,不同等級的使用者在同一時間購買商品的價格對比,不同商品在同一時間的銷量、利潤率等的對比。
縱向對比指的是同一事物在時間維度上的變化,例如,環比、同比和定基比,也就是本月銷售額與上月銷售額的對比,本年度1月份銷售額與上一年度1月份銷售額的對比,本年度每月銷售額分別與上一年度平均銷售額的對比等。
利用對比分析法可以對資料規模大小、水平高低、速度快慢等做出有效的判斷和評價。
2.分組分析法分組分析法是指根據資料的性質、特徵,按照一定的指標,將資料總體劃分為不同的部分,分析其內部結構和相互關係,從而瞭解事物的發展規律。根據指標的性質,分組分析法分為屬性指標分組和數量指標分組。所謂屬性指標代表的是事物的性質、特徵等,如姓名、性別、文化程度等,這些指標無法進行運算;而資料指標代表的資料能夠進行運算,如人的年齡、工資收入等。分組分析法一般都和對比分析法結合使用。
3.預測分析法預測分析法主要基於當前的資料,對未來的資料變化趨勢進行判斷和預測。預測分析一般分為兩種:一種是基於時間序列的預測,例如,依據以往的銷售業績,預測未來3個月的銷售額;另一種是迴歸類預測,即根據指標之間相互影響的因果關係進行預測,例如,根據使用者網頁瀏覽行為,預測使用者可能購買的商品。
4.漏斗分析法漏斗分析法也叫流程分析法,它的主要目的是專注於某個事件在重要環節上的轉化率,在網際網路行業的應用較普遍。比如,對於信用卡申請的流程,使用者從瀏覽卡片資訊,到填寫信用卡資料、提交申請、銀行稽核與批卡,最後使用者啟用並使用信用卡,中間有很多重要的環節,每個環節的使用者量都是越來越少的,從而形成一個漏斗。使用漏斗分析法,能使業務方關注各個環節的轉化率,並加以監控和管理,當某個環節的轉換率發生異常時,可以有針對性地最佳化流程,採取適當的措施來提升業務指標。
5.AB測試分析法AB 測試分析法其實是一種對比分析法,但它側重於對比A、B兩組結構相似的樣本,並基於樣本指標值來分析各自的差異。例如,對於某個App的同一功能,設計了不同的樣式風格和頁面佈局,將兩種風格的頁面隨機分配給使用者,最後根據使用者在該頁面的瀏覽轉化率來評估不同樣式的優劣,瞭解使用者的喜好,從而進一步最佳化產品。
除此之外,要想做好資料分析,讀者還需掌握一定的數學基礎,例如,基本統計量的概念(均值、方差、眾數、中位數等),分散性和變異性的度量指標(極差、四分位數、四分位距、百分位數等),資料分佈(幾何分佈、二項分佈等),以及機率論基礎、統計抽樣、置信區間和假設檢驗等內容,透過相關指標和概念的應用,讓資料分析結果更具專業性。
本文摘自《機器學習測試入門與實踐》
本書全面且系統地介紹了機器學習測試技術與質量體系建設,分為5部分,共15章。第一部分(第1~4章)涵蓋了機器學習、Python程式設計、資料分析的基礎知識;第二部分(第5~7章)介紹了大資料基礎、大資料測試指南及相關工具實踐;第三部分(第8~10章)講解了機器學習測試基礎、特徵專項測試及模型演算法評估測試;第四部分(第11~13章)介紹了模型評估平臺實踐、機器學習工程技術及機器學習的持續交付流程;第五部分(第14章和第15章)探討了AI(Artificial Intelligence)在測試領域的實踐及AI時代測試工程師的未來。
本書能夠幫助讀者瞭解機器學習是如何工作的,瞭解機器學習的質量保障是如何進行的。工程開發人員和測試工程師透過閱讀本書,可以系統化地瞭解大資料測試、特徵測試及模型評估等知識;演算法工程師透過閱讀本書,可以學習模型評測的方法和拓寬模型工程實踐的思路;技術專家和技術管理者透過閱讀本書,可以瞭解機器學習質量保障與工程效能的建設方案。