Tone Error Pattern Detection for Computer-Assisted Learning of Mandarin Chinese
Date Issued
2014
Date
2014
Author(s)
Sou, Ka-hong
Abstract
聲調學習一直是非母語之華語學習者的一大難題,故本論文就其聲調偏誤類型之自動偵測進行初步研究,以期待電腦輔助華語學習者學習。本論文以音節為單位,抽取基頻、能量、長度及其他類別等相關韻律特徵,為每一種聲調建構語者不相關的聲調偏誤偵測模型及相關技術,並自動學習出重要的參數。本論文發現音高軌跡以音節為單位正規化可以去除語者相關的韻律特性,並保留聲調相關的韻律特性;而增加前後音節的聲調類別、音節發音的韻律類別及音節內的音高變化韻律資訊,都能提升聲調偏誤偵測模型的分類效能;而在建構聲調偏誤偵測的模型上,發現使用一種隨機森林變形 (Variant of Random Forest) ,不論在特徵參數選取、模型結合及原訓練集資料的利用上,都優於一般的隨機森林。最後,本論文結合三種正規化特徵訓練的隨機森林變形,提出結合三者優點的方法並考量最適的結合權重,獲得目前最好的分類正確率。本論文提出的韻律特徵參數、聲調偏誤偵測模型及三種正規化特徵的整合方法,可減少基礎實驗 (baseline) 的錯誤接受率約3.92%;錯誤拒絕率約4.89%;診斷錯誤率約5.77%;三者的平均約4.86%。
Subjects
聲調偏誤偵測模型
聲調
基頻
中文韻律
語者不相關
Type
thesis
File(s)![Thumbnail Image]()
Loading...
Name
ntu-103-R01942034-1.pdf
Size
23.32 KB
Format
Adobe PDF
Checksum
(MD5):b52c90963d4bfc9b0c2c7f4910eede9d