介紹
Ajax,全稱為Asynchronous JavaScript and XML,即非同步的JavaScript和XML。這是一種利用JS在保證頁面不被重新整理、頁面連結不變的情況下與伺服器交換資料並更新部分網頁的技術。例如微博的下滑頁面,這就是透過Ajax獲取新資料並呈現的過程。
正文
Ajax的基本原理就不詳細講解了,大致步驟分為三步:傳送請求、解析內容、渲染網頁。這裡主要講一下分析方法
首先借助瀏覽器的開發者工具,chorme的快捷鍵是F12,切換到network選項卡,這就是觀察的介面了。Ajax其實有特殊的請求型別,叫作xhr,拿微博舉例:
點選這個請求,可以檢視這個請求的詳細資訊,如Request Headers、URL和Response Headers等資訊。其中Request Headers中有一個資訊為X-Requested-With,這就標記了此請求是Ajax請求,如圖所示:
隨後點選一下Preview,即可看到響應的內容,為JSON格式。Response選項卡中可以觀察到真實的返回資料。接下來,用chorme的篩選功能選出所有的Ajax請求。然後不斷滑動頁面就可以看到一個個Ajax請求,只需要用程式模擬這些請求,就可以輕鬆提取我們所需要的資訊了。
總結
瞭解了Ajax的分析方法之後,就可以爬取了。具體操作明天再繼續,今天忙了一天,有點累。打算明天再做一個小專案,但暫時沒考慮好做什麼。
介紹
Ajax,全稱為Asynchronous JavaScript and XML,即非同步的JavaScript和XML。這是一種利用JS在保證頁面不被重新整理、頁面連結不變的情況下與伺服器交換資料並更新部分網頁的技術。例如微博的下滑頁面,這就是透過Ajax獲取新資料並呈現的過程。
正文
Ajax的基本原理就不詳細講解了,大致步驟分為三步:傳送請求、解析內容、渲染網頁。這裡主要講一下分析方法
首先借助瀏覽器的開發者工具,chorme的快捷鍵是F12,切換到network選項卡,這就是觀察的介面了。Ajax其實有特殊的請求型別,叫作xhr,拿微博舉例:
點選這個請求,可以檢視這個請求的詳細資訊,如Request Headers、URL和Response Headers等資訊。其中Request Headers中有一個資訊為X-Requested-With,這就標記了此請求是Ajax請求,如圖所示:
隨後點選一下Preview,即可看到響應的內容,為JSON格式。Response選項卡中可以觀察到真實的返回資料。接下來,用chorme的篩選功能選出所有的Ajax請求。然後不斷滑動頁面就可以看到一個個Ajax請求,只需要用程式模擬這些請求,就可以輕鬆提取我們所需要的資訊了。
總結
瞭解了Ajax的分析方法之後,就可以爬取了。具體操作明天再繼續,今天忙了一天,有點累。打算明天再做一個小專案,但暫時沒考慮好做什麼。