Large Vocabulary Continuous Mandarin Speech Recognition with Prosodic Modeling Using Predicted Prosodic Word Boundaries

Lu, Yen-Ting

Large Vocabulary Continuous Mandarin Speech Recognition with Prosodic Modeling Using Predicted Prosodic Word Boundaries

Date Issued

2007

Date

2007

Author(s)

Lu, Yen-Ting

DOI

zh-TW

URI

http://ntur.lib.ntu.edu.tw//handle/246246/52992

Abstract

韻律是日常口語對話中產生之現象，因此在語音辨識系統中加入了韻律的資訊，能使辨識的結果更趨近於人說話時所產生的語句。本論文運用大量韻律資訊訓練韻律模型，並與傳統考慮聲學模型以及語言模型之語音辨識系統結合，得到更佳的辨識率。本論文以音節為單位抽取基頻、能量、長度以及類別參數，訓練聲調與韻律詞邊界之韻律模型；而在韻律模型的訓練上，又以辭典詞與韻律詞分別訓練並比較其產生之韻律模型對辨識系統的幫助。為了得到較豐富的韻律詞邊界資訊，採用條件隨機域的方法，預測了韻律詞的邊界，其準確率、回收率、F1評比以及邊界正確率都在百分之八十以上。此外，亦比較韻律模型對於特定語者與非特定語者之影響。在實驗的架構上，採取兩階段，在第一階段中作傳統的辨識產生詞圖；第二階段根據詞圖中的每個詞弧上音節的時間區間抽取相對應的韻律特徵參數，建立韻律模型後在詞弧上重新計分。實驗結果顯示，以韻律詞訓練之韻律模型有較好的表現，在字元的辨識率上優於傳統模型與辭典詞韻律模型。

Subjects

韻律

詞

模型

詞邊界

聲調

prosodic word

prosodic model

prosodic boundary

tone

Type

thesis

File(s)

Name

ntu-96-R94921024-1.pdf

Size

23.31 KB

Format

Adobe PDF

Checksum

(MD5):c64ceec4bb5654a16da1453f2e9caec6

Large Vocabulary Continuous Mandarin Speech Recognition with Prosodic Modeling Using Predicted Prosodic Word Boundaries

關於 (About)

聯絡資訊 (Contact Us)

相關網站 (Useful Links)

關於開放取用 (Open Access, OA)

出版社期刊論文授權政策 (Copyright)

使用說明 (Instructions)

登入說明 (Sign-in)

匯入著作 (Submission)