朋友扔過來一張圖片,說在整理試題答案,但是試題是圖片,想從網上搜索答案一個一個敲太累了,能不能將圖片裡的文字提取出來?
我一看這是典型的OCR識別啊,直接祭出神器Tesseract.
tesseract -l chi_sim 4.png stdout目二 畫 口 “ 口 出
再對比原圖一看
哦,不,是不是差的有點兒多?
怎麼辦呢?tesseract識別不利,肯定是咱玩的不溜,為了識別幾張圖,再進行一通識別訓練是不是有點兒浪費時間?現在都2020年了,各大廠商都提供這種文字識別服務,像我知道的百度都號稱 50000次/天免費 ,就它了,開幹
第一步 登陸 https://login.bce.baidu.com/
需要百度帳號,是偷是搶,各憑本事吧.
第二步 找到 文字識別 服務
乖乖,這大廠,就是不一樣,產品真多.
第三步 建立一個應用
立即建立
第四步 拿到AppID,API Key,Secret Key
下面是見證五行程式碼的時刻了
第一步 安裝百度Python SDK
pip install baidu-aip
第二步 替換之前拿到 AppID,API Key,Secret Key並修改圖片地址
from aip import AipOcrAPP_ID = 'xxx'API_KEY = 'xxx'SECRET_KEY = 'xxx'IMAGE_URL='~/4.png'client = AipOcr(APP_ID, API_KEY, SECRET_KEY)with open(IMAGE_URL, 'rb') as fp: res = client.basicGeneral(fp.read()) for words_arr in res.get('words_result'): print(words_arr['words'].replace('.口','.').replace('.回','.'))
第三步 run
最新評論