首頁>Club>
7
回覆列表
  • 1 # 阿真60

    這個問題不錯,就此將我使用excel的經驗總結一下。

    excel表格有很多種,即可作為資料來源使用,又可作為統計表,一定情況下,也是非常不錯的資料視覺化工具。

    我這裡主要講的是excel作為資料來源的規則,因為資料來源是excel最基礎最強大的功能,統計分析以及資料展現都是在資料來源的基礎上進行的,資料來源沒有問題,會為後面的操作打下一個良好的基礎。

    即便跳出excel,其他軟體要引用excel資料,也需要一個良好的資料來源格式。

    這些規格,不是說非此不可,只是會在後期的深度加工中或多或少的出現錯誤,錯誤是資料統計分析的大忌,修正錯誤不如在一開始就刻意避免它。

    1、最初的資料最好為一維表

    一維表的特點就是第一行為欄位,每一列都是此欄位下的同類資訊。如下圖所示:

    想對應的,二維是兩個維度對應相應的資料,一般列對應一個維度,行對應一個維度,這樣資料比較直觀,所以常用在彙總表、統計表中,如下圖所示,列為日期,行為產品:

    二維表通常是在一維表基礎上加工而來,所以一維表是基礎。

    一維表和二維表是可以轉換的,這裡就不詳述了。


    2、同列為同類資訊,不要混合

    這個也比較好理解,日期列都是日期,不要夾雜銷量,篩選、計算、計數等等都比較方便。


    3、欄位名稱唯一,且不為空

    欄位是指第一行的名稱,唯一同一個性質的資料放在同列,例如所有的日期都放在日期列裡,欄位名稱也為日期,如果再有一個日期列,可能你自己知道他們的區別,但是別人不知道,機器也不知道,機器運算時就會出錯。當然,日期也可分訂單日期、發貨日期、回款日期等多列。

    不為空是指第一行的欄位名稱不要為空,比如建立透視表時,空欄位就會報錯。


    4、資訊格式正確

    這個是比較常見的錯誤,用文字形式儲存的資料、日期等等。不同的格式在統計中會有不同的結果,這對正確性是非常不利的。

    因此,日期就用日期格式,資料就用數值格式,這個是非常好的習慣,也是規則。


    5、每個單元格最好為單一的資料資訊

    比如銷量列,就是單純的銷售資料,而不要帶有單位,為後期的統計增加不必要的麻煩。如果需要單位,可以另外備註,也可單獨列單位欄位。


    6、不含有合併單元格

    這是因為合併單元格只保留左上角一個單元格中的資料,統計彙總時,其他單元格會當做空值處理,這也會造成後期資料統計的錯誤。


    7、資料來源中不要含有小計

    這個也是經驗之談,原始資料與合計資料混合的表格,會為後期的資料加工帶來不必要的麻煩,比如資料更新時要同時更新合計資料,比如再次加工分析,也要考慮合計的影響。

    因此,資料來源中最好不要任何的合計資料,如果需要,再次加工就好,這樣資料來源可以做為基礎資料,多次使用,按需加工成不同型別的彙總表。


    8、資料來源最好是一個連續的整體,不要有空行或空列

    這個也比較好理解,比如在套用表格式時,空行或空列會直接將表的區域隔開,預設為資料區域到空行或空列為止。

    在資料透視表中,空行或空列也會報錯,或者是空值。


    目前想到的就這些,希望能幫你建立一個完美的資料來源表格~

  • 中秋節和大豐收的關聯?
  • 關於和平價值觀句子