Improved Large Vocabulary Continuous Mandarin Speech Recognition using Character-Based Consensus Networks

Fu, Yi-Sheng

Improved Large Vocabulary Continuous Mandarin Speech Recognition using Character-Based Consensus Networks

Date Issued

2009

Date

2009

Author(s)

Fu, Yi-Sheng

URI

http://ntur.lib.ntu.edu.tw//handle/246246/185371

Abstract

隨著無線網路技術日益成熟，手機與各種智慧型手提裝置逐漸普及，功能也越來越強大，需要更直覺且方便的介面來幫助使用者操作這些裝置。語音是人類溝通最自然且方便的方式，因此被視為下一個世代智慧型裝置與人類溝通最適合的介面之一。但一個好用的語音介面前提是要讓使用者可以連續輸入指令，並且沒有詞彙上的限制。因此大字彙連續語音辨識的技術十分重要。目前學界公認能夠有效處理大字彙連續語音辨識的語音解碼演算法之一是基於詞架構之混淆網路(Word-based Consensus Network)，讓一般原本使詞串(Word Utterance)正確率最大的方法可以變成使詞(Word)的正確率為最大。但是因為在中文語言架構中，詞的定義不清且長短不一，反而字(Character)才是有語意(Semantic)的最小單位，且長度變化較為有限。本論文指出基於詞架構之混淆網路並不是十分切合中文大字彙連續語音辨識，並提出了新的方法:基於字架構之混淆網路(Character-based Consensus Network)。我們以中文廣播新聞為實驗素材，分別使用傳統的語音解碼演算法、基於詞架構之混淆網路、以及基於字架構之混淆網路進行辨識，實驗結果證明了改良後的基於字架構之混淆網路是更適合中文大字彙連續語音辨識的方法。

Subjects

speech recognition

consensus network

Type

thesis

File(s)

Name

ntu-98-R93922076-1.pdf

Size

23.32 KB

Format

Adobe PDF

Checksum

(MD5):06b2bb0c4b5ec1e5c3a83f6e05098b29

Improved Large Vocabulary Continuous Mandarin Speech Recognition using Character-Based Consensus Networks

關於 (About)

聯絡資訊 (Contact Us)

相關網站 (Useful Links)

關於開放取用 (Open Access, OA)

出版社期刊論文授權政策 (Copyright)

使用說明 (Instructions)

登入說明 (Sign-in)

匯入著作 (Submission)