把照相機拍照或掃描器掃描獲得影象中的文字,透過軟體識別的辦法,轉換成Word或其它可編輯文件的方法,叫光學字元識別法(Optical CharacterRecognition),因此對應的應用軟體就叫做OCR軟體。 現在市場上主要的OCR軟體有:方正ocr文字識別軟體、漢王ocr文字識別軟體、捷速ocr文字識別軟體等中國產軟體,它們主要適用於中文的光學字元識別;如果文章中主要是英文文章或英文單詞較多,則推薦購買或下載ABBYYFineReader這個對英文識別效能更好的軟體使用,新版的ABBYYFineReader據說已經可以識別中文,但以個人經驗看,識別中文最好還是華人自己開發的軟體更實用一些,除非主要以識別外文資料為主。 最早能用OCR軟體來識別和轉換文字的是掃描器掃出的影象,因為掃描器掃出的圖片文字沒有變形,清晰度好,識別轉換率也很高,但是掃描的時間較長。按照這個思路,如果沒有條件掃描書籍的,應該在使用數碼相機拍攝並識別書籍時注意以下幾點:把書籍儘可能地放平整,特別是靠近書籍部分的幾列更要注意,防止拍出的照片中四周變形較大影響識別;用相機變形最小的鏡頭焦段,最好是標準鏡頭到人像鏡頭這一段焦距(即單反相機對應的50~85mm,更長的也可以,只是距離書本會更遠,操作不方便)來拍攝要識別的書籍,同時注意使相機鏡頭的中軸線,儘可能地垂直於書本頁面,並透過或靠近頁面的幾何中心,這樣拍出的圖片四周變形小,大批次拍攝時最使好用三腳架上拍攝,使工作效率更高,拍出圖片質量好,今後識別率也更高,把拍好的照片匯入電腦,用PS等軟體,把需要識別的圖片分辯率批次地人工改為220~260dpi,尺寸大小也改為與所拍書箱的大小相近的如A5或A4或A3等尺寸——因為數碼相機一般拍出的圖片尺寸很大(2500px左右或更大),但清晰度較低(一般是72dpi)與OCR軟體要求的差別較大;開啟OCR軟體,按順序呼叫、識別,識別時注意有的軟體要求首先用OCR軟體自帶的水平較正較平後再進行光學識別,可以大大提高字元的識別率。
把照相機拍照或掃描器掃描獲得影象中的文字,透過軟體識別的辦法,轉換成Word或其它可編輯文件的方法,叫光學字元識別法(Optical CharacterRecognition),因此對應的應用軟體就叫做OCR軟體。 現在市場上主要的OCR軟體有:方正ocr文字識別軟體、漢王ocr文字識別軟體、捷速ocr文字識別軟體等中國產軟體,它們主要適用於中文的光學字元識別;如果文章中主要是英文文章或英文單詞較多,則推薦購買或下載ABBYYFineReader這個對英文識別效能更好的軟體使用,新版的ABBYYFineReader據說已經可以識別中文,但以個人經驗看,識別中文最好還是華人自己開發的軟體更實用一些,除非主要以識別外文資料為主。 最早能用OCR軟體來識別和轉換文字的是掃描器掃出的影象,因為掃描器掃出的圖片文字沒有變形,清晰度好,識別轉換率也很高,但是掃描的時間較長。按照這個思路,如果沒有條件掃描書籍的,應該在使用數碼相機拍攝並識別書籍時注意以下幾點:把書籍儘可能地放平整,特別是靠近書籍部分的幾列更要注意,防止拍出的照片中四周變形較大影響識別;用相機變形最小的鏡頭焦段,最好是標準鏡頭到人像鏡頭這一段焦距(即單反相機對應的50~85mm,更長的也可以,只是距離書本會更遠,操作不方便)來拍攝要識別的書籍,同時注意使相機鏡頭的中軸線,儘可能地垂直於書本頁面,並透過或靠近頁面的幾何中心,這樣拍出的圖片四周變形小,大批次拍攝時最使好用三腳架上拍攝,使工作效率更高,拍出圖片質量好,今後識別率也更高,把拍好的照片匯入電腦,用PS等軟體,把需要識別的圖片分辯率批次地人工改為220~260dpi,尺寸大小也改為與所拍書箱的大小相近的如A5或A4或A3等尺寸——因為數碼相機一般拍出的圖片尺寸很大(2500px左右或更大),但清晰度較低(一般是72dpi)與OCR軟體要求的差別較大;開啟OCR軟體,按順序呼叫、識別,識別時注意有的軟體要求首先用OCR軟體自帶的水平較正較平後再進行光學識別,可以大大提高字元的識別率。