抓取WordPress文章可以使用抓取外掛來完成,如使用WP-AutoPost外掛。
啟用WP-AutoPost外掛然後建立新的任務,然後對外掛進行設定即可。
文章抓取設定
在該選項卡下, 我們需要設定文章標題和文章內容的匹配規則,提供兩種方式進行設定,推薦使用CSS選擇器方式,使用該方式更為簡單,精確。
我們只需要設定文章標題CSS選擇器和文章內容CSS選擇器,即可準確抓取文章標題和文章內容。
在文章來源設定裡,我們以採集”新浪網際網路新聞“為例,這裡還是以該例子講解,透過檢視列表網址http://roll.tech.sina.com.cn/internet_worldlist/index.shtml下某一篇文章的原始碼即可輕鬆設定,例如,我們透過檢視某篇具體文章http://tech.sina.com.cn/i/2013-10-18/22298831229.shtml的原始碼,如下所示:
可以看到,文章標題在id為“artibodyTitle”的標籤內部,因此文章標題CSS選擇器只需要設定為 #artibodyTitle 即可;
同樣的,找到文章內容的相關程式碼:
可以看到,文章內容在id為“artibody”的標籤內部,因此文章內容CSS選擇器只需要設定為 #artibody 即可;如下所示:
抓取WordPress文章可以使用抓取外掛來完成,如使用WP-AutoPost外掛。
啟用WP-AutoPost外掛然後建立新的任務,然後對外掛進行設定即可。
文章抓取設定
在該選項卡下, 我們需要設定文章標題和文章內容的匹配規則,提供兩種方式進行設定,推薦使用CSS選擇器方式,使用該方式更為簡單,精確。
我們只需要設定文章標題CSS選擇器和文章內容CSS選擇器,即可準確抓取文章標題和文章內容。
在文章來源設定裡,我們以採集”新浪網際網路新聞“為例,這裡還是以該例子講解,透過檢視列表網址http://roll.tech.sina.com.cn/internet_worldlist/index.shtml下某一篇文章的原始碼即可輕鬆設定,例如,我們透過檢視某篇具體文章http://tech.sina.com.cn/i/2013-10-18/22298831229.shtml的原始碼,如下所示:
可以看到,文章標題在id為“artibodyTitle”的標籤內部,因此文章標題CSS選擇器只需要設定為 #artibodyTitle 即可;
同樣的,找到文章內容的相關程式碼:
可以看到,文章內容在id為“artibody”的標籤內部,因此文章內容CSS選擇器只需要設定為 #artibody 即可;如下所示: