李琳山Lee, Lin-Shan臺灣大學:電信工程學研究所張碩尹Chang, Shuo-YiinShuo-YiinChang2010-07-012018-07-052010-07-012018-07-052009U0001-1307200915395000http://ntur.lib.ntu.edu.tw//handle/246246/188300在傳統的聲學模型中,連續機率密度隱藏馬可夫模型最為被廣泛使用。但是續機率密度隱藏馬可夫模型有一些無法克服的缺點,近年不少研究藉由不同的練方法或是結合不同機器學習的技術以改進連續機率密度隱藏馬可夫模型,這方法在新一代的語音辨識技術上已漸受肯定並普受重視,而且有不少被實踐在項國際競賽中。本論文即是嘗試使用多層感知器來幫助聲學模型辨識的研究。本論文中,我們提出藉由音素分群建立的階層式多層感知器。一般串接模中以單一多層感知器學習概括性的音素分類,很難區分混淆的音素;本論文藉拆解概括性音素分類問題為一組針對性的階層式分類,將複雜的音素分類問題而治之,並且討論在不同的分群結構下階層式多層感知器的表現,之後再以由而上的訓練方法,進一步改進階層式多層感知器。後在以上述的方法為第一階段辨識,由隱藏馬可夫與多層感知器混合模型及隱藏馬可夫(KL)模型重新計分。這些方法在中文大字彙新聞辨識中都證實可使辨識正確率有明確進步。口試委員會審定書............................................................................................................ i謝.................................................................................................................................. ii文摘要.......................................................................................................................... iii容大綱.......................................................................................................................... iv目錄............................................................................................................................ viii目錄............................................................................................................................... x一章 緒論 ........................................................................................................... 1.1 研究動機 ........................................................................................................ 1.2 統計式語音辨識原理 .................................................................................... 2.3 聲學模型 ........................................................................................................ 3.4 語言模型 ........................................................................................................ 4.5 傳統聲學模型的特性 .................................................................................... 5.6 本論文的研究方法 ........................................................................................ 7.7 本論文的研究成果 ........................................................................................ 8二章 串接式聲學模型 ....................................................................................... 9.1 鑑別模型和生成模型的比較 ........................................................................ 9.2 類神經網路分類器 ...................................................................................... 11.3 串接式模型 .................................................................................................. 17i.4 長時間特徵的串接式模型 .......................................................................... 19.5 事後機率特徵的結合 .................................................................................. 22.6 實驗語音資料庫與模型設定 ...................................................................... 22.6.1 實驗語料 ............................................................................................ 22.6.2 訓練與辨識系統工具. ....................................................................... 23.6.3 前端處理. ........................................................................................... 23.6.4 聲學模型設定 .................................................................................... 23.6.5 辭典與語言模型設定. ....................................................................... 24.6.3 前端處理. ........................................................................................... 23.6.4 聲學模型設定 .................................................................................... 23.6.5 辭典與語言模型設定. ....................................................................... 24.7 基礎實驗結果 .............................................................................................. 25.7.1 多層感知器訓練與分類實驗. ........................................................... 25.7.2 串接模型大字彙辨識實驗. ............................................................... 26三章 群聚階層式串接模型 ............................................................................. 29.1 音素距離 ...................................................................................................... 30.2 階層式群聚法 .............................................................................................. 32.3 群聚階層式串接模型 .................................................................................. 36.3.1 高層感知器. ....................................................................................... 36ii.3.2 末端感知器. ....................................................................................... 36.3.3 高層感知器和末端感知器的整合方法. ........................................... 36.4 實驗結果 ...................................................................................................... 37.5 分群結果分析 .............................................................................................. 40.6 本章結論 ...................................................................................................... 42四章 群聚階層式串接模型的改進 ................................................................. 43.1 基於群聚訓練的缺點 .................................................................................. 43.2 群聚階層式串接模型由下而上的處理 ...................................................... 44.3 實驗結果 ...................................................................................................... 46.3.1 基礎實驗 ............................................................................................ 46.2.2 實驗結果 ............................................................................................ 47hapter 5 隱藏馬可夫與多層感知器之混合模型 ................................................. 51.1 隱藏馬可夫與多層感知器混合模型 .......................................................... 51.1.1 隱藏馬可夫與多層感知器混合模型的架構 .................................... 51.1.2 隱藏馬可夫與多層感知器混合模型的訓練 .................................... 53.2 隱藏馬可夫(KL)模型 .................................................................................. 54.3 串接模型和混合模型的比較 ...................................................................... 57.4 實驗結果 ...................................................................................................... 58iii.5 本章結論 ...................................................................................................... 58六章 結論與展望 ............................................................................................. 61.1 結論 .............................................................................................................. 61.2 展望 .............................................................................................................. 61EFERENCE .................................................................................................................. 622955239 bytesapplication/pdfen-US大字彙語音辨識聲學模型多層感知器LVCSRAcoustic ModelMulti-layer Perceptron串接群聚階層式多層感知器聲學模型之中文大字彙語辨識Large Vocabulary Mandarin Speech Recognitionased on Tandem System with Clusteredierarchical Multi-layer Perceptronthesishttp://ntur.lib.ntu.edu.tw/bitstream/246246/188300/1/ntu-98-R96942045-1.pdf