這個問題不錯,就此將我使用excel的經驗總結一下。
excel表格有很多種,即可作為資料來源使用,又可作為統計表,一定情況下,也是非常不錯的資料視覺化工具。
我這裡主要講的是excel作為資料來源的規則,因為資料來源是excel最基礎最強大的功能,統計分析以及資料展現都是在資料來源的基礎上進行的,資料來源沒有問題,會為後面的操作打下一個良好的基礎。
即便跳出excel,其他軟體要引用excel資料,也需要一個良好的資料來源格式。
這些規格,不是說非此不可,只是會在後期的深度加工中或多或少的出現錯誤,錯誤是資料統計分析的大忌,修正錯誤不如在一開始就刻意避免它。
1、最初的資料最好為一維表
一維表的特點就是第一行為欄位,每一列都是此欄位下的同類資訊。如下圖所示:
想對應的,二維是兩個維度對應相應的資料,一般列對應一個維度,行對應一個維度,這樣資料比較直觀,所以常用在彙總表、統計表中,如下圖所示,列為日期,行為產品:
二維表通常是在一維表基礎上加工而來,所以一維表是基礎。
一維表和二維表是可以轉換的,這裡就不詳述了。
2、同列為同類資訊,不要混合
這個也比較好理解,日期列都是日期,不要夾雜銷量,篩選、計算、計數等等都比較方便。
3、欄位名稱唯一,且不為空
欄位是指第一行的名稱,唯一同一個性質的資料放在同列,例如所有的日期都放在日期列裡,欄位名稱也為日期,如果再有一個日期列,可能你自己知道他們的區別,但是別人不知道,機器也不知道,機器運算時就會出錯。當然,日期也可分訂單日期、發貨日期、回款日期等多列。
不為空是指第一行的欄位名稱不要為空,比如建立透視表時,空欄位就會報錯。
4、資訊格式正確
這個是比較常見的錯誤,用文字形式儲存的資料、日期等等。不同的格式在統計中會有不同的結果,這對正確性是非常不利的。
因此,日期就用日期格式,資料就用數值格式,這個是非常好的習慣,也是規則。
5、每個單元格最好為單一的資料資訊
比如銷量列,就是單純的銷售資料,而不要帶有單位,為後期的統計增加不必要的麻煩。如果需要單位,可以另外備註,也可單獨列單位欄位。
6、不含有合併單元格
這是因為合併單元格只保留左上角一個單元格中的資料,統計彙總時,其他單元格會當做空值處理,這也會造成後期資料統計的錯誤。
7、資料來源中不要含有小計
這個也是經驗之談,原始資料與合計資料混合的表格,會為後期的資料加工帶來不必要的麻煩,比如資料更新時要同時更新合計資料,比如再次加工分析,也要考慮合計的影響。
因此,資料來源中最好不要任何的合計資料,如果需要,再次加工就好,這樣資料來源可以做為基礎資料,多次使用,按需加工成不同型別的彙總表。
8、資料來源最好是一個連續的整體,不要有空行或空列
這個也比較好理解,比如在套用表格式時,空行或空列會直接將表的區域隔開,預設為資料區域到空行或空列為止。
在資料透視表中,空行或空列也會報錯,或者是空值。
目前想到的就這些,希望能幫你建立一個完美的資料來源表格~
這個問題不錯,就此將我使用excel的經驗總結一下。
excel表格有很多種,即可作為資料來源使用,又可作為統計表,一定情況下,也是非常不錯的資料視覺化工具。
我這裡主要講的是excel作為資料來源的規則,因為資料來源是excel最基礎最強大的功能,統計分析以及資料展現都是在資料來源的基礎上進行的,資料來源沒有問題,會為後面的操作打下一個良好的基礎。
即便跳出excel,其他軟體要引用excel資料,也需要一個良好的資料來源格式。
這些規格,不是說非此不可,只是會在後期的深度加工中或多或少的出現錯誤,錯誤是資料統計分析的大忌,修正錯誤不如在一開始就刻意避免它。
1、最初的資料最好為一維表
一維表的特點就是第一行為欄位,每一列都是此欄位下的同類資訊。如下圖所示:
想對應的,二維是兩個維度對應相應的資料,一般列對應一個維度,行對應一個維度,這樣資料比較直觀,所以常用在彙總表、統計表中,如下圖所示,列為日期,行為產品:
二維表通常是在一維表基礎上加工而來,所以一維表是基礎。
一維表和二維表是可以轉換的,這裡就不詳述了。
2、同列為同類資訊,不要混合
這個也比較好理解,日期列都是日期,不要夾雜銷量,篩選、計算、計數等等都比較方便。
3、欄位名稱唯一,且不為空
欄位是指第一行的名稱,唯一同一個性質的資料放在同列,例如所有的日期都放在日期列裡,欄位名稱也為日期,如果再有一個日期列,可能你自己知道他們的區別,但是別人不知道,機器也不知道,機器運算時就會出錯。當然,日期也可分訂單日期、發貨日期、回款日期等多列。
不為空是指第一行的欄位名稱不要為空,比如建立透視表時,空欄位就會報錯。
4、資訊格式正確
這個是比較常見的錯誤,用文字形式儲存的資料、日期等等。不同的格式在統計中會有不同的結果,這對正確性是非常不利的。
因此,日期就用日期格式,資料就用數值格式,這個是非常好的習慣,也是規則。
5、每個單元格最好為單一的資料資訊
比如銷量列,就是單純的銷售資料,而不要帶有單位,為後期的統計增加不必要的麻煩。如果需要單位,可以另外備註,也可單獨列單位欄位。
6、不含有合併單元格
這是因為合併單元格只保留左上角一個單元格中的資料,統計彙總時,其他單元格會當做空值處理,這也會造成後期資料統計的錯誤。
7、資料來源中不要含有小計
這個也是經驗之談,原始資料與合計資料混合的表格,會為後期的資料加工帶來不必要的麻煩,比如資料更新時要同時更新合計資料,比如再次加工分析,也要考慮合計的影響。
因此,資料來源中最好不要任何的合計資料,如果需要,再次加工就好,這樣資料來源可以做為基礎資料,多次使用,按需加工成不同型別的彙總表。
8、資料來源最好是一個連續的整體,不要有空行或空列
這個也比較好理解,比如在套用表格式時,空行或空列會直接將表的區域隔開,預設為資料區域到空行或空列為止。
在資料透視表中,空行或空列也會報錯,或者是空值。
目前想到的就這些,希望能幫你建立一個完美的資料來源表格~