python用requests獲取網頁原始碼為什麼中文顯示錯誤？

首頁>Club>2021-05-04 22:49

python用requests獲取網頁原始碼為什麼中文顯示錯誤？

15

回覆列表

1 # 我是阿嘛

檢視一下網頁的編碼，比如是gbk的話，就r.encoding="gbk"。一下內容摘自requests文件

Requests會自動解碼來自伺服器的內容。大多數unicode字符集都能被無縫地解碼。

請求發出後，Requests會基於HTTP頭部對響應的編碼作出有根據的推測。當你訪問 r.text 之時，Requests會使用其推測的文字編碼。你可以找出Requests使用了什麼編碼，並且能夠使用 r.encoding 屬性來改變它:
r.encoding

"utf-8"

r.encoding = "ISO-8859-1"

如果你改變了編碼，每當你訪問 r.text ，Request都將會使用 r.encoding 的新值。你可能希望在使用特殊邏輯計算出文字的編碼的情況下來修改編碼。比如 HTTP 和 XML 自身可以指定編碼。這樣的話，你應該使用 r.content 來找到編碼，然後設定 r.encoding 為相應的編碼。這樣就能使用正確的編碼解析 r.text 了。

相關內容

∧ 中秋節和大豐收的關聯？

∨ 老上火應該吃什麼去火？

熱門排行