陳信希臺灣大學:資訊工程學研究所曾郁淳Tzeng, Yu-ChunYu-ChunTzeng2007-11-262018-07-052007-11-262018-07-052005http://ntur.lib.ntu.edu.tw//handle/246246/54110本論文研究多語問答,擬將單語問答系統擴展到處理更多語言,也就是某一種語言的問題,不再限於根據同一語言的文件,去找出問題的答案,而是可以跨語言問答。舉例來說,給定中文問句,以及英文文件,希望找出英文文件中此問題的答案,回傳給使用者。這樣一來,可以利用到的資源較多,也能讓使用者獲得更多相關的答案。 本文將翻譯的問題,放在問句的部分,也就是去作「問句翻譯」,除了基本的查字典翻譯,我們還利用網路資源來擷取未知詞的翻譯,並從答對數、答對平均排名和查詢時間,三個方面來作效能評估。而「答案整合」的部分,則是要將多語問答系統在不同語言的文件中,找到的相同答案合併,並且重新排序輸出。 最後,我們使用NTCIR-5的CLQA task的CE -Subtasks的問題集和文件集,來作中英問答實驗,測試多語問答系統的效能。實驗結果正確率為15.33%,MRR為0.06236,相對於英文單語問答,效能減低大約三分之一。摘要 i 索引 ii 附圖目錄 iv 附表目錄 v 第1章 導論 1 1.1 研究動機 1 1.2 相關研究 1 1.2.1 問答系統 1 1.2.2 跨語言資訊檢索 2 1.3 研究目標 3 1.4 論文編排 4 第2章 多語問答系統架構 5 2.1 中文斷詞及詞性標記系統 5 2.2 資訊檢索系統 6 2.3 具名實體辨識系統 7 2.4 問答系統核心 7 第3章 問句翻譯與答案整合 9 3.1 問句翻譯 9 3.1.1 查字典 9 3.1.2 利用網路資源翻譯 10 3.2 答案整合 19 第4章 多語問答系統實驗 22 4.1 實驗資料 22 4.2 評估方式 23 4.3 多語與單語問答系統之效能 23 4.4 效能比較 25 4.5 錯誤分析 27 4.5.1 斷詞錯誤 27 4.5.2 問句翻譯錯誤 28 4.5.3 問句分析錯誤 29 4.5.4 文件層次抽取答案的影響 30 第5章 結論與未來研究 32 5.1 結論 32 5.2 未來研究 32 參考文獻 34 附錄一 TREC 2002問句中文翻譯 36831356 bytesapplication/pdfen-US多語問答系統問答系統Multilingual Question Answering SystemsQA多語問答系統之研究A Study on Multilingual Question Answering Systemsthesishttp://ntur.lib.ntu.edu.tw/bitstream/246246/54110/1/ntu-94-R92922004-1.pdf