之前寫了篇Python批次爬取網頁資料的文章,後來發現Excel隨著版本的迭代,已經完全支援多頁面抓取資料了,不用擼程式碼,點點滑鼠就能抓取資料,讓我們一起看看吧~
網頁解析在抓取資料之前,先對網頁進行一下解析,下圖中是豆瓣TOP250初始頁面,拉到最底部可以發現一共有10個頁面,每個頁面25部電影,一共250部電影。
我們依次獲取前三個頁面的網址可以發現它們之間的規律,每個網址除了中間的數字,其它地方都是一樣的,數字從0/25/50,以25遞增(每個頁面的電影數),一共10個頁面。
發現規律之後,我們將10個頁面之間的數字儲存在一張表中備用,下圖A列所示,留存備用。
資料抓取Excel2016及其以上版本內嵌了從Web批次抓取的功能(“資料”—“新建查詢”—“從其它源”—“從Web”),案例演示的版本未達到,所以我下載了一個Power BI Desktop(Excel延伸產品),免費安裝免費使用,效果同Excel,不用擔心不會使用,會用Excel就會操作。
介面設定:
導航器介面之後程式會進入抓取資料狀態,稍等會兒,跳出“導航器”介面,左側有一張表“表1”,勾選之後,右側展示表明細資料,可以發現就是豆瓣TOP250的首頁面的25部電影;
(p as number) as table =>
接著將第三行程式碼中的數字【“0”】替換為【(Number.ToText(p))】,如下圖所示:
(Number.ToText(p))
批次呼叫,批次抓取資料
接著點選【新建源】—【Excel】,選擇第一步留存備用的Excel表格,匯入之後,點選【新增列】—【呼叫自定義函式】,下拉功能查詢選擇【表1】,點選確定。
小結不會擼程式碼的我們,曾對資料爬取望而生畏,隨著ExcelBI工具的豐富,資料抓取也將變得簡單化,快去嘗試下吧~
如果你沒有安裝高版本的Excel,不妨試著安裝下Power BI Desktop,十分方便,不用註冊,開啟就可以使用,應用商店Microsoft store搜Power BI Desktop下載即可。