基於識別向量分群與深層類神經網路之語者調適

電機資訊學院: 電信工程學研究所指導教授: 李琳山楊子毅Yang, Tzu-iTzu-iYang2017-03-062018-07-052017-03-062018-07-052015http://ntur.lib.ntu.edu.tw//handle/246246/276466語音辨識的使用日趨廣泛,大量出現於各種應用環境中,而語者調適愈顯得日趨重要。深層類神經網路亦已成為聲學模型的主流,本論文將各語者的平均識別向量分群,分別為每一群語者訓練特定的深層類神經網路模型,再用這些事前訓練好的模型來作語者調適。本論文提出兩種作法,一是以測試語者的識別向量做為選擇標準,挑出最適合的語者分群模型;另一者則用監督式方法學習出結合向量來整合各個模型的輸出結果。我們使用高度口語化、個人化及雙語特性之語料測試,發現本論文所提出的架構在調適語料少時能迅速提升辨識正確率,並且在調適語料數目增加時也有不錯的表現。2663868 bytesapplication/pdf論文公開時間: 2015/7/22論文使用權限: 同意有償授權(權利金給回饋學校)深層類神經網路識別向量語者調適向量結合語者分群deep neural networki-vectorspeaker adaptationvector combinationspeaker clustering基於識別向量分群與深層類神經網路之語者調適Speaker Adaptation over Deep Neural Network by Clustering Identity Vectorsthesishttp://ntur.lib.ntu.edu.tw/bitstream/246246/276466/1/ntu-104-R02942100-1.pdf