首頁>科技>

朋友扔過來一張圖片,說在整理試題答案,但是試題是圖片,想從網上搜索答案一個一個敲太累了,能不能將圖片裡的文字提取出來?

我一看這是典型的OCR識別啊,直接祭出神器Tesseract.

tesseract -l chi_sim 4.png stdout目二 畫 口 “ 口 出

再對比原圖一看

哦,不,是不是差的有點兒多?

怎麼辦呢?tesseract識別不利,肯定是咱玩的不溜,為了識別幾張圖,再進行一通識別訓練是不是有點兒浪費時間?現在都2020年了,各大廠商都提供這種文字識別服務,像我知道的百度都號稱 50000次/天免費 ,就它了,開幹

第一步 登陸 https://login.bce.baidu.com/

需要百度帳號,是偷是搶,各憑本事吧.

第二步 找到 文字識別 服務

乖乖,這大廠,就是不一樣,產品真多.

第三步 建立一個應用

立即建立

第四步 拿到AppID,API Key,Secret Key

下面是見證五行程式碼的時刻了

第一步 安裝百度Python SDK

pip install baidu-aip

第二步 替換之前拿到 AppID,API Key,Secret Key並修改圖片地址

from aip import AipOcrAPP_ID = 'xxx'API_KEY = 'xxx'SECRET_KEY = 'xxx'IMAGE_URL='~/4.png'client = AipOcr(APP_ID, API_KEY, SECRET_KEY)with open(IMAGE_URL, 'rb') as fp:    res         = client.basicGeneral(fp.read())    for words_arr in res.get('words_result'):        print(words_arr['words'].replace('.口','.').replace('.回','.'))

第三步 run

最新評論
  • 整治雙十一購物亂象,國家再次出手!該跟這些套路說再見了
  • MIUI進化史——好用,卻不再發燒