回覆列表
-
1 # 程式設計字典
-
2 # 五四瘋哥
學爬蟲沒別的辦法,實踐,網上的教程一大堆,照著做那麼幾個也就入門了,以後多練就可以了。從最簡單的爬蟲開始,怎麼get,怎麼post,怎麼加header,怎麼傳form,怎麼傳body體,返回的結果用正則怎麼處理,用xpath怎麼處理,這些都會了,那做啥也不怵了,至少研究的時候有方向了。
學爬蟲沒別的辦法,實踐,網上的教程一大堆,照著做那麼幾個也就入門了,以後多練就可以了。從最簡單的爬蟲開始,怎麼get,怎麼post,怎麼加header,怎麼傳form,怎麼傳body體,返回的結果用正則怎麼處理,用xpath怎麼處理,這些都會了,那做啥也不怵了,至少研究的時候有方向了。
預備知識
您應該對計算機程式設計術語和Python有基本的瞭解。XPath的基本理解是一個優點。
Scrapy環境(教程http://codingdict.com/article/4917)
Scrapy命令列工具
Scrapy蜘蛛
Scrapy選擇器
Scrapy專案
Scrapy Item Loaders
Scrapy shell
Scrapy Item Pipeline
Scrapy Feed exports
Scrapy請求和響應
Scrapy連結提取器
Scrapy設定
Scrapy異常
Scrapy 建立一個專案
Scrapy定義一個專案
Scrapy第一蜘蛛
Scrapy爬取
Scrapy提取專案
Scrapy 使用Item
Scrapy跟蹤連結
Scrapy 儲存資料
Scrapy記錄
Scrapy統計收集
Scrapy傳送電子郵件
Scrapy Telnet控制檯
Scrapy Web服務