陳信希臺灣大學:資訊工程學研究所李俐瑩Lee, Li-YingLi-YingLee2007-11-262018-07-052007-11-262018-07-052005http://ntur.lib.ntu.edu.tw//handle/246246/53831隨著網際網路的蓬勃發展,文字資訊逐漸電子化,在大量的資料下,如何有效率的瀏覽感到興趣的資訊變得越來越重要。在過去的相關研究中,多文件摘要則是為了迎合這樣的需求而被提出。 然而,傳統的多文件摘要著重於文件重要內容的整理分析,但是,若使用者有興趣的資訊是社會大眾對某個事件的看法,而不僅僅是事件內容的話,這樣的多文件摘要並不能滿足使用者的需求。根據觀察,使用者有興趣的資訊愈來愈傾向偏重與意見相結合的部分,而不再單單是事件本身。比如說,民眾會比較想要知道有關當局對於大陸送貓熊給臺灣這事件的看法,而不是詳細的細節規劃。因此,我們提出意見摘要的方法,藉由對社會上其他人士想法的了解,進一步掌握主流民意及社會潮流,也就是說,希望能藉著這樣的摘要方式,自動化的收集相關意見,分析整理,進而提出言簡意赅的意見摘要。摘要 I 索引 II 附圖目錄 IV 附表目錄 V 第一章 緒論 1 1.1. 研究動機 1 1.2. 意見摘要介紹 1 1.3. 相關研究 2 1.4. 實驗文件集介紹 4 1.5. 意見摘要方法介紹 7 1.6. 論文編排 8 第二章 主題偵測 9 2.1. 目的 9 2.2. 特徵選取 10 2.3. 文件分群 12 2.3.1. 文件分群實驗 13 2.3.2. 文件分群結論 14 2.4. 代表詞挑選 16 2.5. 相關句擷取 16 2.5.1. 代表詞選取效能評估 16 2.5.2. 討論 17 第三章 事件為基礎的意見摘要 20 3.1. 目的 20 3.2. 意見摘要方法 20 3.2.1. 意見擷取及傾向分析 21 3.2.1.1. 目的 21 3.2.1.2. 意見句判斷 - 相關研究 22 3.2.1.3. 意見句判斷 - 我們的方法 22 3.2.2. 語句分群 24 3.2.3. 代表句挑選 24 3.2.4. 長句縮短 25 3.3. 事件為基礎的意見摘要呈現 26 3.4. 討論 28 第四章 意見持有人為基礎的意見摘要 30 4.1. 研究目的 30 4.2. 意見摘要方法 30 4.2.1. 意見句擷取 31 4.2.2. 意見持有人分群 32 4.3. 意見持有人為基礎的意見摘要呈現 33 4.4. 實驗結果與討論 36 第五章 結論與未來研究 40 5.1. 結論 40 5.2. 未來研究 40 參考資料 43 附錄一 華航空難文章 45 附錄二 TREC 2003 相關句擷取結果評估 46 附錄三 TREC 2004 相關句擷取結果評估 47 附錄四 表述詞 48818528 bytesapplication/pdfen-US意見摘要opinionsummarization意見摘要方法之研究A Study of Opinion Summarizationthesishttp://ntur.lib.ntu.edu.tw/bitstream/246246/53831/1/ntu-94-R92922008-1.pdf