Large Vocabulary Mandarin Speech Recognitionased on Tandem System with Clusteredierarchical Multi-layer Perceptron
Date Issued
2009
Date
2009
Author(s)
Chang, Shuo-Yiin
Abstract
在傳統的聲學模型中,連續機率密度隱藏馬可夫模型最為被廣泛使用。但是續機率密度隱藏馬可夫模型有一些無法克服的缺點,近年不少研究藉由不同的練方法或是結合不同機器學習的技術以改進連續機率密度隱藏馬可夫模型,這方法在新一代的語音辨識技術上已漸受肯定並普受重視,而且有不少被實踐在項國際競賽中。本論文即是嘗試使用多層感知器來幫助聲學模型辨識的研究。本論文中,我們提出藉由音素分群建立的階層式多層感知器。一般串接模中以單一多層感知器學習概括性的音素分類,很難區分混淆的音素;本論文藉拆解概括性音素分類問題為一組針對性的階層式分類,將複雜的音素分類問題而治之,並且討論在不同的分群結構下階層式多層感知器的表現,之後再以由而上的訓練方法,進一步改進階層式多層感知器。後在以上述的方法為第一階段辨識,由隱藏馬可夫與多層感知器混合模型及隱藏馬可夫(KL)模型重新計分。這些方法在中文大字彙新聞辨識中都證實可使辨識正確率有明確進步。
Subjects
LVCSR
Acoustic Model
Multi-layer Perceptron
Type
thesis
File(s)![Thumbnail Image]()
Loading...
Name
ntu-98-R96942045-1.pdf
Size
23.32 KB
Format
Adobe PDF
Checksum
(MD5):0c8a2bd12170d713ef4e9fd47f869262
