指導教授:李琳山臺灣大學:電信工程學研究所蘇嘉雄Sou, Ka-hongKa-hongSou2014-11-302018-07-052014-11-302018-07-052014http://ntur.lib.ntu.edu.tw//handle/246246/264332聲調學習一直是非母語之華語學習者的一大難題,故本論文就其聲調偏誤類型之自動偵測進行初步研究,以期待電腦輔助華語學習者學習。本論文以音節為單位,抽取基頻、能量、長度及其他類別等相關韻律特徵,為每一種聲調建構語者不相關的聲調偏誤偵測模型及相關技術,並自動學習出重要的參數。本論文發現音高軌跡以音節為單位正規化可以去除語者相關的韻律特性,並保留聲調相關的韻律特性;而增加前後音節的聲調類別、音節發音的韻律類別及音節內的音高變化韻律資訊,都能提升聲調偏誤偵測模型的分類效能;而在建構聲調偏誤偵測的模型上,發現使用一種隨機森林變形 (Variant of Random Forest) ,不論在特徵參數選取、模型結合及原訓練集資料的利用上,都優於一般的隨機森林。最後,本論文結合三種正規化特徵訓練的隨機森林變形,提出結合三者優點的方法並考量最適的結合權重,獲得目前最好的分類正確率。本論文提出的韻律特徵參數、聲調偏誤偵測模型及三種正規化特徵的整合方法,可減少基礎實驗 (baseline) 的錯誤接受率約3.92%;錯誤拒絕率約4.89%;診斷錯誤率約5.77%;三者的平均約4.86%。口試委員會審定書--------------------------------------------------------------- (i) 致謝-------------------------------------------------------------------------------- (ii) 中文摘要------------------------------------------------------------------------- (iii) 第一章 導論 1.1研究動機---------------------------------------------------------------- (1) 1.2相關背景與國語聲調辨識簡介------------------------------------- (2) 1.3本論文之研究方法與主要成果------------------------------------- (4) 1.4章節概要---------------------------------------------------------------- (5) 第二章 研究基礎簡介 2.1 中文語音的韻律訊號------------------------------------------------ (6) 2.2 分類法------------------------------------------------------------------ (7) 2.2.1決策樹----------------------------------------------------------- (7) 2.2.2隨機森林-------------------------------------------------------- (9) 2.2.3 隨機森林變形------------------------------------------------- (11) 2.3 機器模型比較-------------------------------------------------------- (13) 2.4實驗語料及基礎實驗------------------------------------------------ (15) 2.4.1 基礎實驗語料------------------------------------------------- (15) 2.4.2 聲學特徵參數------------------------------------------------- (17) 2.4.3 聲學模型架構------------------------------------------------- (17) 2.4.4音節邊界的強制對齊----------------------------------------- (20) 第三章 韻律特徵參數擷取 3.1音高軌跡精緻化------------------------------------------------------ (23) 3.1.1音高軌跡連續化----------------------------------------------- (24) 3.1.2音高軌跡正規化之以句子為單位-------------------------- (24) 3.1.3音高軌跡正規化之以音節為單位------------------------- (28) 3.1.4音高軌跡標準化之以音節為單位------------------------- (34) 3.2 韻律特徵參數擷取-------------------------------------------------- (35) 3.2.1音高特徵參數------------------------------------------------- (36) 3.2.2長度特徵參數------------------------------------------------- (37) 3.2.3能量特徵參數------------------------------------------------- (37) 3.2.4新發現的韻律特徵------------------------------------------- (38) 3.2.4.1音高變化特徵參數----------------------------------- (38) 3.2.4.2相鄰聲調特徵參數----------------------------------- (39) 3.2.4.3聲學類別特徵參數----------------------------------- (40) 3.2.4.4音節位置特徵參數----------------------------------- (41) 第四章 中文韻律下聲調模型之建立 4.1不均勻類別標籤調整方法----------------------------------------- (42) 4.2聲調偏誤偵測模型之建立----------------------------------------- (43) 4.2.1 語言學觀點之韻律特徵參數------------------------------ (44) 4.2.2決策樹聲調偏誤偵測模型---------------------------------- (44) 4.2.3隨機森林之韻律聲調偏誤偵測模型---------------------- (45) 4.2.4隨機森林變形之韻律聲調偏誤偵測模型---------------- (46) 4.2.5系統架構圖---------------------------------------------------- (47) 4.3本章結論-------------------------------------------------------------- (48) 第五章 實驗結果與綜合討論 5.1衡量方法與實驗設定------------------------------------------------ (49) 5.1.1四種衡量指標的定義---------------------------------------- (50) 5.1.2實驗設定------------------------------------------------------- (50) 5.1.3四種衡量指標以各聲調的原始分佈作加權------------- (50) 5.2隨機森林實驗結果--------------------------------------------------- (51) 5.3隨機森林變形實驗結果--------------------------------------------- (52) 5.4不同正規化方法做混合的結果------------------------------------ (54) 5.5混淆矩陣--------------------------------------------------------------- (57) 5.6綜合討論--------------------------------------------------------------- (60) 第六章 結論與展望 6.1 結論-------------------------------------------------------------------- (61) 6.2 展望-------------------------------------------------------------------- (61) 參考文獻------------------------------------------------------------------------ (62) 附錄A----------------------------------------------------------------------------(67)1885745 bytesapplication/pdf論文公開時間:2019/07/29論文使用權限:同意有償授權(權利金給回饋學校)聲調偏誤偵測模型聲調基頻中文韻律語者不相關電腦輔助華語學習之聲調偏誤類型偵測Tone Error Pattern Detection for Computer-Assisted Learning of Mandarin Chinesethesishttp://ntur.lib.ntu.edu.tw/bitstream/246246/264332/1/ntu-103-R01942034-1.pdf