1. 前言
最近,微軟開源了一款非常強大的 Python 自動化依賴庫:playwright-python
它支援主流的瀏覽器,包含:Chrome、Firefox、Safari、Microsoft Edge 等,同時支援以無頭模式、有頭模式執行
playwright-python 提供了同步、非同步的 API,可以結合 Pytest 測試框架使用,並且支援瀏覽器端的自動化指令碼錄製
2. 準備在實戰之前,我們只需要 2 步
第 1 步,安裝 playwright-python 依賴庫
# 安裝依賴庫pip3 install playwright
第 2 步,安裝主流的瀏覽器驅動
這樣,會將 Chromeium、Firefox、Webkit 瀏覽器驅動下載到本地
# 安裝瀏覽器驅動python -m playwright install
3. 實戰一下3-1 錄製指令碼
我們先檢視錄製指令碼的命令說明
其中
python -m playwright codegen 錄製指令碼--help 幫助文件-o 生成自動化指令碼的目錄--target 指令碼語言,包含 JS 和 Python,分別對應值為:python 和 javascript-b 指定瀏覽器驅動
比如
# 我們透過下面命令開啟 Chrome 瀏覽器開始錄製指令碼# 指定生成語言為:Python(預設Python,可選)# 儲存的檔名:1.py(可選)# 瀏覽器驅動:webkit(預設webkit,可選)# 最後跟著要開啟的目標網站(預設僅僅是開啟瀏覽器,可選)python -m playwright codegen --target python -o '1.py' -b webkit https://www.baidu.com
接著,在瀏覽器模擬搜尋一次的操作,然後關閉瀏覽器
最後,自動化指令碼會自動生成,儲存到檔案中
from playwright import sync_playwrightdef run(playwright): browser = playwright.webkit.launch(headless=False) context = browser.newContext() # Open new page page = context.newPage() # Go to https://www.baidu.com/ page.goto("https://www.baidu.com/") # Fill input[name="wd"] page.fill("input[name=\"wd\"]", "AirPython") # Press Enter # with page.expect_navigation(url="https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&rsv_idx=1&tn=baidu&wd=AirPython&fenlei=256&rsv_pq=a1739d870005eec3&rsv_t=e640wwS33ra1Koivxvy1WyTxyknRwnllWiw4JBqIYd/KUN/WKpWLtL2b2+0&rqlang=cn&rsv_enter=1&rsv_dl=tb&rsv_sug3=21&rsv_sug1=18&rsv_sug7=100&rsv_sug2=0&rsv_btype=i&inputT=6199&rsv_sug4=6199"): with page.expect_navigation(): page.press("input[name=\"wd\"]", "Enter") # Close page page.close() # --------------------- context.close() browser.close()with sync_playwright() as playwright: run(playwright)
3-2 同步
同步的關鍵字為:sync_playwright
比如,我們依次使用三個瀏覽器核心開啟瀏覽器,然後百度一下,接著對在搜尋介面截圖,最後關閉瀏覽器
from time import sleepfrom playwright import sync_playwright# 注意:預設是無頭模式with sync_playwright() as p: # 分別對應三個瀏覽器驅動 for browser_type in [p.chromium, p.firefox, p.webkit]: # 指定為有頭模式,方便檢視 browser = browser_type.launch(headless=False) page = browser.newPage() page.goto('http://baidu.com') # 執行一次搜尋操作 page.fill("input[name=\"wd\"]", "AirPython") with page.expect_navigation(): page.press("input[name=\"wd\"]", "Enter") # 等待頁面載入完全 page.waitForSelector("text=百度熱榜") # 截圖 page.screenshot(path=f'example-{browser_type.name}.png') # 休眠5s sleep(5) # 關閉瀏覽器 browser.close()
需要指出的是,playwright-python 內建的 API 基本上囊括常見的自動化操作
3-3 非同步
非同步步的關鍵字為:async_playwright
結合 asyncio,我們同時執行上面的操作
import asynciofrom playwright import async_playwright# 非同步執行async def main(): async with async_playwright() as p: for browser_type in [p.chromium, p.firefox, p.webkit]: # 指定為有頭模式,方便檢視 browser = await browser_type.launch(headless=False) page = await browser.newPage() await page.goto('http://baidu.com') # 執行一次搜尋操作 await page.fill("input[name=\"wd\"]", "AirPython") await page.press("input[name=\"wd\"]", "Enter") # 等待頁面載入完全 await page.waitForSelector("text=百度熱榜") # 截圖 await page.screenshot(path=f'example-{browser_type.name}.png') await browser.close()asyncio.get_event_loop().run_until_complete(main())
4. 最後事實上,Playwright 是一個跨語言的自動化框架,支援 Python、Java、JS 等
Playwright 相比傳統的自動化框架 Selenium 來說,在 Context 上下文及 API 使用上,顯得更簡潔且強大!