Improved Technologies for Distributed Speech Recognition : Feature Compression, Extra Transmission Functionalities and Integrated System Simulation
Date Issued
2004
Date
2004
Author(s)
Hsu, Wei-Hao
DOI
zh-TW
Abstract
隨著行動通訊的日漸發展,一種架構在無通訊網路上的語音辨識服務—分散式語音辨識系統也愈顯得其重要性:用戶端透過無線手持設備,以語音對遠端伺服器發送指令或要求等服務。有鑒於手持設備的方便性,我們沒辨法在用戶端進行太多運算複雜或是需要大量計憶體的處理,但以現有語音編碼技術在遠端伺服器所得到的還原語音其辨識率太差,因此較可行的方法是在用戶端執行語音特徵參數的抽取與壓縮,並將壓縮後的資料經過無線通道傳送至伺服器端進行特徵參數的還原與辨識是目前分散式語音系統的主要研究方向。本論文的主題即是著重在如何發展上述主從架構(client-server model)分散式語音辨識系統的進一步技術並架構在現今的GPRS (General Radio Packet Service) 通訊系統之上。為了克服通道錯誤與滿足系統即時性(real time)的要求,本論文提出了新的語音特徵參數壓縮法,使壓縮後的資料傳輸速率約為傳統分割式向量量化壓縮法的資料傳輸速率的三分之一;另外提出了一套完整的外加傳送機制—結合錯誤更正碼與錯誤補償技術,使本系統即使在通道平均位元錯誤率高達 的情況下,也能維持極高的語音辨識率。
在本論文的第一章中,我們首先會介紹分散式語音辨識系統的概念及所面對的問題。在第二章中,我們對整個辨識系統作介紹—包括語料庫說明、本系統所採用的聲學模型,並且簡介GPRS行動通訊系統。在第三章中,我們將介紹本論文所提出的語音特徵參數壓縮法,並且與傳統分割式向量量化壓縮法相比較,另外並討論在不同語言、有背景雜訊干擾時,所提出的語音特徵參數壓縮法之壓縮效能。在第四章中我們會介紹我們所提出的外加傳送機制—利用錯誤更正碼保護傳輸資料,並且利用錯誤補償技術提高整體系統的辨識率。而在第五章裡,我們將以電腦模擬本系統在GPRS通訊系統上的效能—觀察我們所提出的語音特徵參數壓縮法與外加傳送機制是否能降低分散式語音辨識系統受到傳輸錯誤的影響。最後在第六章中我們將詳述本論文所得到的結論並提出一些未來需要繼續努力的方向。
在本論文的第一章中,我們首先會介紹分散式語音辨識系統的概念及所面對的問題。在第二章中,我們對整個辨識系統作介紹—包括語料庫說明、本系統所採用的聲學模型,並且簡介GPRS行動通訊系統。在第三章中,我們將介紹本論文所提出的語音特徵參數壓縮法,並且與傳統分割式向量量化壓縮法相比較,另外並討論在不同語言、有背景雜訊干擾時,所提出的語音特徵參數壓縮法之壓縮效能。在第四章中我們會介紹我們所提出的外加傳送機制—利用錯誤更正碼保護傳輸資料,並且利用錯誤補償技術提高整體系統的辨識率。而在第五章裡,我們將以電腦模擬本系統在GPRS通訊系統上的效能—觀察我們所提出的語音特徵參數壓縮法與外加傳送機制是否能降低分散式語音辨識系統受到傳輸錯誤的影響。最後在第六章中我們將詳述本論文所得到的結論並提出一些未來需要繼續努力的方向。
Subjects
分散式語音辨識系統
Distributed Speech Recognition
Type
thesis
File(s)![Thumbnail Image]()
Loading...
Name
ntu-93-R91942030-1.pdf
Size
23.31 KB
Format
Adobe PDF
Checksum
(MD5):0a34d11595f2410aa6d8cef28ef4ae7f