Topic segmentation on lecture corpus and its application
Date Issued
2008
Date
2008
Author(s)
Hsu, Shou-Chieh
Abstract
隨著資訊爆炸的時代來臨,網路所帶來的便利漸漸改變我們的生活,包含語音訊息的多媒體文件成為資訊瀏覽的熱門媒介,網路課程學習正是藉由網路來降低學習的障礙,整合了影音、文字、圖形等資源來傳遞知識。為了提供使用者快速便捷的課程內容,若以人工的方式來分析與整理課程語料是一件非常耗時費工的事情,如何能以自動化方式來達到這些目標便成為一個主要的課題。本論文中針對具有高度自發性及雙語性質的課程語料,依據課程本身的架構,提出了以課程投影片為基準的主題切割與校準。我們將主題切割的過程分為兩個步驟,分別利用動態規劃切割以及隱藏式馬可夫模型校準,自動的為語音辨識過後的文件找出各段落所隸屬的主題,並以實驗顯示該方法能夠克服語料中語言的落差以及辨識錯誤。此外,本論文也依據每一主題所包含的資訊做群集與索引,將各階段的結果整合至一視覺化的瀏覽介面中,提供使用者一個結構化的課程學習方式。
Subjects
speech
lecture
topic segmentation
Type
thesis
File(s)![Thumbnail Image]()
Loading...
Name
ntu-97-R95922081-1.pdf
Size
23.32 KB
Format
Adobe PDF
Checksum
(MD5):0f544d9ddbc70d2cbba1e7bbd6f4a8a4