簡述OCR文字識別的工作原理？

首頁>Club>2021-02-21 15:06

簡述OCR文字識別的工作原理？

回覆列表

1 # A名字都被起完了1

1、影象輸入、預處理：　　影象輸入：對於不同的影象格式，有著不同的儲存格式，不同的壓縮方式。預處理：主要包括二值化，噪聲去除，傾斜較正等2、二值化：　　對攝像頭拍攝的圖片，大多數是彩色影象，彩色影象所含資訊量巨大，對於圖片的內容，我們可以簡單的分為前景與背景，為了讓計算機更快的，更好的識別文字，我們需要先對彩色圖進行處理，使圖片只前景資訊與背景資訊，可以簡單的定義前景資訊為黑色，背景資訊為白色，這就是二值化圖了。　　3、噪聲去除：　　對於不同的文件，我們對燥聲的定義可以不同，根據燥聲的特徵進行去燥，就叫做噪聲去除　　4、傾斜較正：　　由於一般使用者，在拍照文件時，都比較隨意，因此拍照出來的圖片不可避免的產生傾斜，這就需要文字識別軟體進行較正。　　版面分析：　　5、將文件圖片分段落，分行的過程就叫做版面分析，由於實際文件的多樣性，複雜性，因此，目前還沒有一個固定的，最優的切割模型。　　6、字元切割：　　由於拍照條件的限制，經常造成字元粘連，斷筆，因此極大限制了識別系統的效能，這就需要文字識別軟體有字元切割功能。　　7、字元識別：　　這一研究，已經是很早的事情了，比較早有模板匹配，後來以特徵提取為主，由於文字的位移，筆畫的粗細，斷筆，粘連，旋轉等因素的影響，極大影響特徵的提取的難度。　　8、版面恢復：　　人們希望識別後的文字，仍然像原文件圖片那樣排列著，段落不變，位置不變，順序不變，的輸出到word文件,pdf文件等，這一過程就叫做版面恢復。　　9、後處理、校對：　　根據特定的語言上下文的關係，對識別結果進行較正，就是後處理。　　開發一個OCR文字識別軟體[2]系統，其目的很簡單，只是要把影像作一個轉換，使影像內的圖形繼續儲存、有表格則表格內資料及影像內的文字，一律變成計算機文字，使能達到影像資料的儲存量減少、識別出的文字可再使用及分析，當然也可節省因鍵盤輸入的人力與時間。從影像到結果輸出，須經過影像輸入、影像前處理、文字特徵抽取、比對識別、最後經人工校正將認錯的文字更正，將結果輸出。

∧ 中秋節和大豐收的關聯？

∨ 胡蘿蔔你在什麼季節種植？

熱門排行

劇多

簡述OCR文字識別的工作原理？