Large Vocabulary Continuous Mandarin Speech Recognition with Prosodic Modeling Using Predicted Prosodic Word Boundaries
Date Issued
2007
Date
2007
Author(s)
Lu, Yen-Ting
DOI
zh-TW
Abstract
韻律是日常口語對話中產生之現象,因此在語音辨識系統中加入了韻律的資訊,能使辨識的結果更趨近於人說話時所產生的語句。本論文運用大量韻律資訊訓練韻律模型,並與傳統考慮聲學模型以及語言模型之語音辨識系統結合,得到更佳的辨識率。 本論文以音節為單位抽取基頻、能量、長度以及類別參數,訓練聲調與韻律詞邊界之韻律模型;而在韻律模型的訓練上,又以辭典詞與韻律詞分別訓練並比較其產生之韻律模型對辨識系統的幫助。為了得到較豐富的韻律詞邊界資訊,採用條件隨機域的方法,預測了韻律詞的邊界,其準確率、回收率、F1評比以及邊界正確率都在百分之八十以上。此外,亦比較韻律模型對於特定語者與非特定語者之影響。 在實驗的架構上,採取兩階段,在第一階段中作傳統的辨識產生詞圖;第二階段根據詞圖中的每個詞弧上音節的時間區間抽取相對應的韻律特徵參數,建立韻律模型後在詞弧上重新計分。實驗結果顯示,以韻律詞訓練之韻律模型有較好的表現,在字元的辨識率上優於傳統模型與辭典詞韻律模型。
Subjects
韻律
詞
模型
詞邊界
聲調
prosodic word
prosodic model
prosodic boundary
tone
Type
thesis
File(s)![Thumbnail Image]()
Loading...
Name
ntu-96-R94921024-1.pdf
Size
23.31 KB
Format
Adobe PDF
Checksum
(MD5):c64ceec4bb5654a16da1453f2e9caec6