回覆列表
  • 1 # 我是阿嘛

    檢視一下網頁的編碼,比如是gbk的話,就r.encoding="gbk"。一下內容摘自requests文件

    Requests會自動解碼來自伺服器的內容。大多數unicode字符集都能被無縫地解碼。

    請求發出後,Requests會基於HTTP頭部對響應的編碼作出有根據的推測。當你訪問 r.text 之時,Requests會使用其推測的文字編碼。你可以找出Requests使用了什麼編碼,並且能夠使用 r.encoding 屬性來改變它:

    r.encoding

    "utf-8"

    r.encoding = "ISO-8859-1"

    如果你改變了編碼,每當你訪問 r.text ,Request都將會使用 r.encoding 的新值。你可能希望在使用特殊邏輯計算出文字的編碼的情況下來修改編碼。比如 HTTP 和 XML 自身可以指定編碼。這樣的話,你應該使用 r.content 來找到編碼,然後設定 r.encoding 為相應的編碼。這樣就能使用正確的編碼解析 r.text 了。

  • 中秋節和大豐收的關聯?
  • 老上火應該吃什麼去火?