-
1 # 小混混7129
-
2 # 瓜果飄香科技
用php模擬登陸主要分為三部分
1. post資料。
2.根據返回的http頭,從中截出cookie段。
3.偽造http頭髮送請求。 我這裡以用php抓取163相簿的需要密碼才能訪問的目錄為例。 <?php function posttohost($url, $data) //post資料 { $url = parse_url($url); if (!$url) return "couldn"t parse url"; if (!isset($url["port"])) { $url["port"] = ""; } if (!isset($url["query"])) { $url["query"] = ""; } $encoded = ""; foreach ($data as $k=>$v) { $encoded .= ($encoded ? "&" : ""); $encoded .= rawurlencode($k)."=".rawurlencode($v); } $fp = fsockopen($url["host"], $url["port"] ? $url["port"] : 80); if (!$fp) return "Failed to open socket to $url[host]"; fputs($fp, sprintf("POST %s%s%s HTTP/1.0\n", $url["path"], $url["query"] ? "?" : "", $url["query"])); fputs($fp, "Host: $url[host]\n"); fputs($fp, "Content-type: application/x-www-form-urlencoded\n"); fputs($fp, "Content-length: " . strlen($encoded) . "\n"); fputs($fp, "Connection: close\n\n"); fputs($fp, "$encoded\n"); $line = fgets($fp,1024); if (!eregi("^HTTP/1\.. 200", $line)) return; $results = ""; $inheader = 1; while(!feof($fp)) { $line = fgets($fp,1024); if ($inheader && ($line == "\n" || $line == "\r\n")) { $inheader = 0; } elseif ($inheader) { $results .= $line; } } fclose($fp); return $results; }
回覆列表
這種模擬登陸其實很簡單,php的話主要用curl來實現。仔細研究一下你要抓的站具體是怎麼實現使用者登入的,可以用wireshark或者burpsuite(建議用後者)抓包看看整個過程都有那幾次請求,每次請求都發送了哪些資料,構造好發給他就可以實現登入了。之後獲取個人資訊就很容易了,找找php解析html庫,或者最簡單粗暴的就是字串擷取函式加正則表示式,把你想要的資料提取出來就好了。對於你給出的這種驗證碼屬於非常容易識別的驗證碼了,基本的識別原理參看使用Canvas進行驗證碼識別。當然比較蛋疼的問題就是網頁編碼問題,經常爬過來全是亂碼,網上找找看轉碼的方法,都試一下,這是一門玄學,能不能成功看你人品和耐心吧。