有時我們需要從網站獲取一些資料,傳統方法是透過複製貼上,直接粘到Excel裡。不過由於網頁結構不同,並非所有的複製都能有效。有時即便成功了,得到的也是“死資料”,一旦後期有更新,就要不斷重複上述操作。能否製作一個隨網站自動同步的Excel表呢?答案是肯定的,這就是Excel裡的Power Query功能。
1. 開啟網頁
下圖這個網頁,是中國地震臺網的官方頁面(http://news.ceic.ac.cn/)。每當有地震發生時,就會自動更新到這裡。既然我們要抓取它,就要首先開啟這個網頁。
首先開啟要抓取的網頁
2. 確定抓取範圍
開啟Excel,點選“資料”→“獲取資料”→“自其他源”,將要抓取的網址貼上進來。此時Power Query會自動對網頁進行分析,然後將分析結果顯示在選框內。以本文為例,Power Query共分析出兩組表格,點選找到我們所需的那個,然後再點選“轉換資料”。片刻後,Power Query就會自動完成匯入。
建立查詢,確定抓取範圍
3. 資料清洗
匯入完成後,就可以透過Power Query進行資料清洗了。所謂“清洗”說白了就是一個預篩選過程,我們可以在這裡挑選自己所需的記錄,或者對不需要的列進行刪除與排序操作。其中右鍵負責刪除資料列,面板中的“保留行”用來篩選自己所需的記錄。清洗完成後,點選左上角的“關閉並上載”即可上傳Excel。
資料“預清洗”
4. 格式調整
資料上傳Excel後,可以繼續進行格式化處理。這裡的處理主要包括修改表樣式、文字大小、背景色、對齊、行高列寬,新增標題等等,通俗點說就是一些美化操作,最終我們便得到了下圖這個表。
對錶格進行一些美化處理
5. 設定自動同步間隔
目前表格基礎已經完成,但和複製貼上一樣,此時得到的仍然只是一堆“死資料”。想讓表格自動更新,需要點選“查詢工具”→“編輯”→“屬性”,並勾選其中的“重新整理頻率”和“開啟檔案時重新整理資料”。處理完成後,表格就可以自動同步了。
設定內容自動同步
防止更新時破壞表格式
寫在最後
這個技巧很實用,特別是在製作一些動態報表時,能夠大大減輕人工提取所產生的麻煩。好了,這就是本期要和大家分享的一個小技巧,是不是很有用呢!