李琳山臺灣大學:電信工程學研究所王祐邦Wang, Yow-BangYow-BangWang2010-07-012018-07-052010-07-012018-07-052008U0001-2407200823345100http://ntur.lib.ntu.edu.tw//handle/246246/188185在語音合成或其他各種語音系統的輸出中,如果希望語音具有某種特定的韻律表現,最簡便且普遍的做法就是使用音高同步疊加法或者相角音碼器。然而目前國內關於韻律調整之研究,對於相角音碼器的探討仍不多;而有關相角音碼器的國外期刊論文則往往偏重理論描述,而缺乏實作的細節。因此,本論文的主要目的就是希望能實現相角音碼器,並以之進行語音韻律調整。論文主要分為兩大部分:第一部分,包括第二章以及第三章,是對相角音碼器原理的解說。我們試圖深入頻譜的物理意義,以探討包括相角音碼器最初的雛型,以及後來包括鎖相相角音碼器等等的各種改進方法。二部分,包括第四章,則是相角音碼器的實作。我們參考了數篇近期的期刊論文,並整合音高與音節長度的調整,而成為一個完整的語音韻律調整系統。同時我們也對實作中會遇到的種種問題以及參數設定的細節進行處理與討論。口試委員會審定書 #謝 i要 iii錄 v目錄 viii一章 導論 1.1 研究動機 1.2 相角音碼器簡介 1.3 章節大綱 2二章 基礎背景簡介 3.1 短時間傅立葉轉換與頻譜 3.1.1 短時間傅立葉轉換 3.1.2 短時間傅立葉分析與窗函數 3.1.3 頻譜 5.1.4 短時間傅立葉合成 7.2 相角與瞬時頻率 7.3 韻律調整 10.3.1 時間量度調整 10.3.2 音高平移 13.4 音源—濾波器模型 15.5 線性預測編碼 16.6 其他估測頻譜包絡線的方法 18.6.1 真實包絡線估測 18.6.2 線性預測正則化 20.7 本章結論 21三章 相角音碼器的改進 23.1 頻譜峰與影響區間 23.2 鎖相相角音碼器 24.2.1 時間量度調整 24.2.2 音高平移 27.3 基於窗函數頻率響應之音高平移 30.4 正弦頻率平移與追蹤 33.5 暫態偵測與保存 34.6 本章結論 34四章 相角音碼器應用於語音訊號韻律調整 37.1 系統架構 37.2 音高輪廓精緻化 39.3 語音訊號之雜訊消除 39.3.1 語音端點偵測 39.3.2 頻譜相減法 40.4 增益控制 41.5 線性預測分析 41.5.1 參數設定 41.5.2 線性預測係數內插 43.6 短時間傅立葉轉換 43.7 音高平移 45.8 線性預測合成 47.9 時間量度調整 48.10 本章結論 50五章 結論與展望 51.1 結論 51.2 展望 51考文獻 531042771 bytesapplication/pdfen-US相角音碼器語音韻律調整聲音轉換Phase Vocoderspeech prosody modificationvoice conversion相角音碼器及其在語音韻律調整之應用Phase Vocoder and its Applications in Speech Prosody Modificationthesishttp://ntur.lib.ntu.edu.tw/bitstream/246246/188185/1/ntu-97-R95942056-1.pdf