李琳山臺灣大學:資訊工程學研究所許守傑Hsu, Shou-ChiehShou-ChiehHsu2010-05-182018-07-052010-05-182018-07-052008U0001-2907200800485300http://ntur.lib.ntu.edu.tw//handle/246246/183627隨著資訊爆炸的時代來臨,網路所帶來的便利漸漸改變我們的生活,包含語音訊息的多媒體文件成為資訊瀏覽的熱門媒介,網路課程學習正是藉由網路來降低學習的障礙,整合了影音、文字、圖形等資源來傳遞知識。為了提供使用者快速便捷的課程內容,若以人工的方式來分析與整理課程語料是一件非常耗時費工的事情,如何能以自動化方式來達到這些目標便成為一個主要的課題。本論文中針對具有高度自發性及雙語性質的課程語料,依據課程本身的架構,提出了以課程投影片為基準的主題切割與校準。我們將主題切割的過程分為兩個步驟,分別利用動態規劃切割以及隱藏式馬可夫模型校準,自動的為語音辨識過後的文件找出各段落所隸屬的主題,並以實驗顯示該方法能夠克服語料中語言的落差以及辨識錯誤。此外,本論文也依據每一主題所包含的資訊做群集與索引,將各階段的結果整合至一視覺化的瀏覽介面中,提供使用者一個結構化的課程學習方式。摘要 ii一章 1.1 研究動機 1.2 相關研究 2.3 研究方法 3.4 章節大綱 3二章 5.1 主題切割的基本概念 5.2 基本模型 6.2.1 向量空間模型 7.2.2 動態規劃切割模型 8.2.3 隱藏式馬可夫模型 12.3 語音文件與文字文件之差異 16.4 主題切割評估機制 17.5 本章結論 20三章 21.1 研究方法概述 21.2 基於文字資訊之動態規劃分割 23.2.1 建立向量空間文件 23.2.2 計算距離矩陣 26.2.3 動態規劃切割演算法 27.3 隱藏式馬可夫模型校準 28.3.1 基本模型定義 28.3.2 維特比演算法 31四章 33.1 實驗語料概述 33.2 實驗結果 35.3 本章結論 40五章 43.1 系統架構概述 43.1.1 課程文件 44.1.2 系統呈現方式 45.2 系統各元件之討論 47.2.1 相關文件群集 47.2.2 詞彙檢索 51.3本章結論 53六章 55.1 結論 55.2 展望 57考文獻 61application/pdf1031988 bytesapplication/pdfen-US語音課程主題切割speechlecturetopic segmentation課程語料之主題切割及其應用Topic segmentation on lecture corpus and its applicationthesishttp://ntur.lib.ntu.edu.tw/bitstream/246246/183627/1/ntu-97-R95922081-1.pdf