https://scholars.lib.ntu.edu.tw/handle/123456789/122766
標題: | 串接群聚階層式多層感知器聲學模型之中文大字彙語辨識 Large Vocabulary Mandarin Speech Recognitionased on Tandem System with Clusteredierarchical Multi-layer Perceptron |
作者: | 張碩尹 Chang, Shuo-Yiin |
關鍵字: | 大字彙語音辨識;聲學模型;多層感知器;LVCSR;Acoustic Model;Multi-layer Perceptron | 公開日期: | 2009 | 摘要: | 在傳統的聲學模型中,連續機率密度隱藏馬可夫模型最為被廣泛使用。但是續機率密度隱藏馬可夫模型有一些無法克服的缺點,近年不少研究藉由不同的練方法或是結合不同機器學習的技術以改進連續機率密度隱藏馬可夫模型,這方法在新一代的語音辨識技術上已漸受肯定並普受重視,而且有不少被實踐在項國際競賽中。本論文即是嘗試使用多層感知器來幫助聲學模型辨識的研究。本論文中,我們提出藉由音素分群建立的階層式多層感知器。一般串接模中以單一多層感知器學習概括性的音素分類,很難區分混淆的音素;本論文藉拆解概括性音素分類問題為一組針對性的階層式分類,將複雜的音素分類問題而治之,並且討論在不同的分群結構下階層式多層感知器的表現,之後再以由而上的訓練方法,進一步改進階層式多層感知器。後在以上述的方法為第一階段辨識,由隱藏馬可夫與多層感知器混合模型及隱藏馬可夫(KL)模型重新計分。這些方法在中文大字彙新聞辨識中都證實可使辨識正確率有明確進步。 |
URI: | http://ntur.lib.ntu.edu.tw//handle/246246/188300 |
顯示於: | 電信工程學研究所 |
檔案 | 描述 | 大小 | 格式 | |
---|---|---|---|---|
ntu-98-R96942045-1.pdf | 23.32 kB | Adobe PDF | 檢視/開啟 |
在 IR 系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。