Options
Improved Large Vocabulary Continuous Mandarin Speech Recognition using Character-Based Consensus Networks
Date Issued
2009
Date
2009
Author(s)
Fu, Yi-Sheng
Abstract
隨著無線網路技術日益成熟,手機與各種智慧型手提裝置逐漸普及,功能也越來越強大,需要更直覺且方便的介面來幫助使用者操作這些裝置。語音是人類溝通最自然且方便的方式,因此被視為下一個世代智慧型裝置與人類溝通最適合的介面之一。但一個好用的語音介面前提是要讓使用者可以連續輸入指令,並且沒有詞彙上的限制。因此大字彙連續語音辨識的技術十分重要。 目前學界公認能夠有效處理大字彙連續語音辨識的語音解碼演算法之一是基於詞架構之混淆網路(Word-based Consensus Network),讓一般原本使詞串(Word Utterance)正確率最大的方法可以變成使詞(Word)的正確率為最大。但是因為在中文語言架構中,詞的定義不清且長短不一,反而字(Character)才是有語意(Semantic)的最小單位,且長度變化較為有限。本論文指出基於詞架構之混淆網路並不是十分切合中文大字彙連續語音辨識,並提出了新的方法:基於字架構之混淆網路(Character-based Consensus Network)。 我們以中文廣播新聞為實驗素材,分別使用傳統的語音解碼演算法、基於詞架構之混淆網路、以及基於字架構之混淆網路進行辨識,實驗結果證明了改良後的基於字架構之混淆網路是更適合中文大字彙連續語音辨識的方法。
Subjects
speech recognition
consensus network
Type
thesis
File(s)
No Thumbnail Available
Name
ntu-98-R93922076-1.pdf
Size
23.32 KB
Format
Adobe PDF
Checksum
(MD5):06b2bb0c4b5ec1e5c3a83f6e05098b29