這個實現起來挺簡單的,主要分為3步,先爬取電影資訊,再發送到自己手機,最後定時執行指令碼就行,下面我簡單介紹一下主要過程,實驗環境win7+python3.6+pycharm5.0,主要內容如下:
這裡為了方便說明問題,以爬取迅雷之家的電影為例,地址https://www.xl720.com/,如下:
1.首先,爬取電影資訊,因為是靜態網頁,所以根據原始碼,直接請求頁面,解析頁面就行,如下:
網頁原始碼結構如下:
對應解析程式碼如下,這裡主要用到requests+BeautifulSoup,比較簡單:
3.接著就是在main函式中呼叫這2個方法,測試一下能否爬取資訊,並且透過郵箱傳送,主要程式碼如下:
程式執行截圖如下,可以直接在手機qq上看到爬取的電影資訊,如下:
4.最後就是定時執行這個指令碼,這裡可以將其放在伺服器上面,設定crontab命令,定時執行這個指令碼,如下,我這裡每隔2天,分別在10點和17點30分爬取一次電影資訊,不會crontab命令的可以自己在網上搜一下,很簡單:
這個實現起來挺簡單的,主要分為3步,先爬取電影資訊,再發送到自己手機,最後定時執行指令碼就行,下面我簡單介紹一下主要過程,實驗環境win7+python3.6+pycharm5.0,主要內容如下:
這裡為了方便說明問題,以爬取迅雷之家的電影為例,地址https://www.xl720.com/,如下:
1.首先,爬取電影資訊,因為是靜態網頁,所以根據原始碼,直接請求頁面,解析頁面就行,如下:
網頁原始碼結構如下:
對應解析程式碼如下,這裡主要用到requests+BeautifulSoup,比較簡單:
3.接著就是在main函式中呼叫這2個方法,測試一下能否爬取資訊,並且透過郵箱傳送,主要程式碼如下:
程式執行截圖如下,可以直接在手機qq上看到爬取的電影資訊,如下:
4.最後就是定時執行這個指令碼,這裡可以將其放在伺服器上面,設定crontab命令,定時執行這個指令碼,如下,我這裡每隔2天,分別在10點和17點30分爬取一次電影資訊,不會crontab命令的可以自己在網上搜一下,很簡單: