基於百度API五行程式碼實現OCR文字高識別率！五行程式碼這還不叼嘛？

首頁>科技>地表嘴強程式設計師2020-03-31 20:24

基於百度API五行程式碼實現OCR文字高識別率！五行程式碼這還不叼嘛？

朋友扔過來一張圖片,說在整理試題答案,但是試題是圖片,想從網上搜索答案一個一個敲太累了,能不能將圖片裡的文字提取出來?

我一看這是典型的OCR識別啊,直接祭出神器Tesseract.

tesseract -l chi_sim 4.png stdout目二 畫 口 “ 口 出

再對比原圖一看

哦,不,是不是差的有點兒多?

怎麼辦呢?tesseract識別不利,肯定是咱玩的不溜,為了識別幾張圖,再進行一通識別訓練是不是有點兒浪費時間?現在都2020年了,各大廠商都提供這種文字識別服務,像我知道的百度都號稱 50000次/天免費 ,就它了,開幹

第一步登陸 https://login.bce.baidu.com/

需要百度帳號,是偷是搶,各憑本事吧.

第二步找到文字識別服務

乖乖,這大廠,就是不一樣,產品真多.

第三步建立一個應用

立即建立

第四步拿到AppID,API Key,Secret Key

下面是見證五行程式碼的時刻了

第一步安裝百度Python SDK

pip install baidu-aip

第二步替換之前拿到 AppID,API Key,Secret Key並修改圖片地址

from aip import AipOcrAPP_ID = &#39;xxx&#39;API_KEY = &#39;xxx&#39;SECRET_KEY = &#39;xxx&#39;IMAGE_URL=&#39;~/4.png&#39;client = AipOcr(APP_ID, API_KEY, SECRET_KEY)with open(IMAGE_URL, &#39;rb&#39;) as fp:    res         = client.basicGeneral(fp.read())    for words_arr in res.get(&#39;words_result&#39;):        print(words_arr[&#39;words&#39;].replace(&#39;.口&#39;,&#39;.&#39;).replace(&#39;.回&#39;,&#39;.&#39;))

第三步 run

322

百度

Python

最新評論

∧ 整治雙十一購物亂象，國家再次出手！該跟這些套路說再見了

∨ MIUI進化史——好用，卻不再發燒

劇多

基於百度API五行程式碼實現OCR文字高識別率！五行程式碼這還不叼嘛？

百度

Python