Language Context-based Enhancement for Chinese Optical Character Recognition

Wang, Shih-Han

Language Context-based Enhancement for Chinese Optical Character Recognition

Date Issued

2015

Date

2015

Author(s)

Wang, Shih-Han

URI

http://ntur.lib.ntu.edu.tw//handle/246246/271582

Abstract

隨著時代演進，人們對於電子產品的使用已逐漸普及。傳達文字訊息的方式，由過去的書寫文字，進而進展成現在的數位文字。促使文本數位化的需求提升。為了使影像轉換為數位文字，市面上已有開發光學文字辨識系統，能將影像做自動轉換數位文字，但是這些系統主要是針對現代印刷字體。至於非印刷體文字，如手寫字、雕版印刷等，其辨識率並不佳。因此，本研究，為了改善現有光學文字辨識軟體正確率，增加使用者數位化文本的便利性以減少使用之人力成本。本研究流程主要分為二步驟，第一步驟：將文本作結構的分析，切割出字符影像，避免切割不完全使得辨識時造成辨識錯誤。第二步驟分為兩個部分，第一部分是將切割出的字符，以方向梯度直方圖(HOG)來表示字符特徵。將字符依特徵向量作粗略分群，再以文本之語言模型，觀察其分群情況，增加其分群效果。最後根據分群的結果，作錯誤辨識的偵測，以及改正其錯誤文字；第二部分是將文本利用現有之文字辨識軟體，將影像轉為數位文字，透過外部文本的語言模型來偵測與改正錯誤文字。最後比較這兩部分之錯誤字偵測及修正情形。本研究方法與使用Plustek DI express 6.0辨識的結果作比較，在使用內部文本的部分，增加5%的辨識正確率，從65%增加至70%。而使用外部文本的部分，則是增加了9.8%的辨識正確率。

Subjects

Chinese character recognition

Language model

Optical Character Recognition

Type

thesis

File(s)

Name

ntu-104-R02525063-1.pdf

Size

23.54 KB

Format

Adobe PDF

Checksum

(MD5):98d30dce5261678fff30a19f73dc1026

Language Context-based Enhancement for Chinese Optical Character Recognition

關於 (About)

聯絡資訊 (Contact Us)

相關網站 (Useful Links)

關於開放取用 (Open Access, OA)

出版社期刊論文授權政策 (Copyright)

使用說明 (Instructions)

登入說明 (Sign-in)

匯入著作 (Submission)