“教育資訊化”是資訊與資訊科技在教育中的應用與推廣,它的發展離不開各種資訊科技的支援。光學字元識別(Optical Character Recognition,簡稱 OCR)是人工智慧技術之一,針對印刷體字元,採用光學的方式將紙質文件中的文字轉換成為黑白點陣的影象檔案,並通過識別軟體將影象中的文字轉換成文字格式,它讓“計算機”和“ 人”一樣, 看圖識字。
OCR 技術最大化的方便了資訊以“更自由的”方式進行快速高效地傳播。其中,百度大腦 OCR 基於深度學習技術,更是突破了很多外在環境限制,在教育領域中極大地促進了教育資訊化的發展,滿足了千萬老師、學生、家長以及培訓機構等等多方的日常需求。
百度大腦 OCR 技術具備識別準確率高、場景覆蓋多、語種豐富、相容性強等特性,支援文件電子化,卡證核驗、財會報銷、交通物流、教育培訓、內容稽核等各類文字識別場景,以及中、英、日、韓、法、德、意等20多種語種,並可以雲端、嵌入式、私有化等多種部署方式賦能多種多樣的場景。
目前,這一技術已被教育行業迫切應用,“解放知識分享的生產力”,減輕家長輔導的壓力、提升老師閱卷效率,同時也實現了高校智慧化管理考生資訊。
拍照搜題: 媽媽再也不用擔心孩子作業不會做近日,“浙江杭州吳先生輔導孩子寫作業時把自己的手用繩子綁在了身後”的新聞引起了廣泛熱議。“反覆講過的題,還是一遍遍地錯,我心裡那個火啊。”吳先生這樣解釋到。這句話似乎道出了所有家長在輔導孩子寫作業時的“崩潰”心態。面對家長輔導作業的“世紀難題”,一款叫做“導學號”的 App 研發了可以準確對課本題目進行識別的“一鍵拍照解題”功能,讓孩子不用家長的“苦心”“手把手”輔導,也能自行搜尋解題思路和答案,幫助家長減輕了輔導壓力。
導學號 App 是一款專門為中小學生設計的專業輔導應用。在大多數實際使用場景下,市面上現有的“拍照解題”功能,容易受到拍照角度、環境光線、裝置配置、書本的顏色差異等因素的各種影響,從而使得題目的識別準確率很低,導致使用者體驗較差。
為提升識別準確率,導學號 App 接入了百度大腦結合深度學習技術的 OCR 通用文字識別技術。使用者只需通過導學號自定義相機拍攝題目,裁切選中需要搜尋的題目,App 會快速準確識別題目,然後自動通過搜尋引擎搜尋答案,為使用者返回匹配度最高的題目及題目的解析輔導內容。
在接入百度大腦 OCR 技術後,導學號 App 有效字元識別率大幅提升40%,題目搜尋成功率由原來的56%提升至98%。在提升了識別搜尋準確率的同時,大大優化了體驗,也相應地減輕了家長輔導壓力與學生的自學壓力。
▲ 導學號 APP 拍照搜題流程
智慧閱卷: 將老師從繁瑣的批改中解放出來在教育領域中的另一經典場景中,閱卷對老師來說一直以來都是一項繁重的機械式“勞動”。隨著2019年漸入尾聲,每年歲末的期末考試也隨之而來。期末考不僅僅是對學生的考驗,也是對閱卷老師的“體力考驗”。龐大的閱卷工程造成閱卷老師過度疲勞的同時,也難免面臨著因人工批改帶來的批閱誤差。
“河南悅學” 是一家主要從事網際網路科技應用服務的新興技術公司,在其數字教材應用雲軟體中運用了百度大腦 OCR 手寫識別和數字識別技術,來幫助老師實現智慧閱卷,解決了閱卷老師手動閱卷易出錯、耗時多的難題。
通過這兩項技術對經過分割處理的答題卡圖片進行掃描,一方面,能夠智慧識別學生考號、姓名等資訊,以此來判斷學生的身份;另一方面,也可以自動識別試卷中的客觀題答案,自動計算考生分數,生成考生的個人學科分析報告,最終以四芒星圖來展示學生的學業水平和解答能力,幫助老師更加直觀地了解考生的學業狀況。
相較於傳統手動批閱試卷的方式,接入了百度大腦 OCR 技術的智慧閱卷方式節約了老師約40%的時間,大大解放了被束縛於閱卷重複勞動的老師,也提升了閱卷效率。
考生資訊智慧化管理: 資訊化時代高校的有效“管理法”此外,考生資訊管理也是 OCR 技術落地的一大重要領域。據教育部公佈資料顯示,2019年全國高考報名人數達1031萬,而即將到來的考研,報名人數也已達290萬。如何對如此龐大的考生報考資訊進行有效的管理與錄入,同時在報考志願填寫期間對海量的招生資訊進行電子化管理,讓考生和家長更快捷的獲取,也成了資訊化時代高校智慧化管理的重要課題之一。
針對考生准考證資訊的有效錄入與管理,蘇州白鴿雲通過整合百度大腦 iOCR 自定義模板文字識別開發平臺,成功搭建了高校 CET(大學英語四六級考試)考生資訊管理系統,能快速精準地對 CET 准考證檔案中多項考生資訊(如:考生姓名、准考證號、座位等)及學生成績報告單中的關鍵欄位進行結構化識別提取,並將其自動錄入高校教務系統、考生資訊檔案,幫助各大高校降低了人工錄入造成的校驗成本,縮減了超40%的人力成本,從而實現了高校對 CET 考生資訊及考試成績的智慧化便捷管理。
▲ 白鴿雲對高校 CET 考生資訊的錄入
除了蘇州白鴿雲通過 iOCR 自定義模板文字識別開發平臺對準考證資訊進行結構化識別之外,杭州布穀科技也推出了高考志願填報類 App 雲志願,來幫助高校實現招生資訊的智慧化管理。運用了百度大腦 OCR 技術及 NLP 技術的雲志願 App 在短短的2天內就完成了對全國28個省份的《招生計劃》和《報考指南》的全部電子化工作,在電子化錄入的過程中,節省了89%的時間成本和75%的人力成本,同時也為考生與家長帶來了良好的查詢體驗。
目前,百度 OCR 技術已通過百度大腦 AI 開放平臺全面開放給第三方使用,以打破封閉的研發生態,積極推動技術在具體場景上的落地。
除了教育場景外,百度大腦 OCR 技術也已在醫療、交通、財稅等場景實現了通用化的綜合解決方案,未來百度大腦 OCR 也將繼續利用技術優勢,助力更多行業場景的智慧化升級。
進入https://ai.baidu.com/tech/ocr_education,了解教育場景 OCR 應用案例。