謝尚賢臺灣大學:土木工程學研究所林顯堂Lin, Hsien-TangHsien-TangLin2010-07-012018-07-092010-07-012018-07-092009U0001-1407200916055100http://ntur.lib.ntu.edu.tw//handle/246246/187867本研究以發展土木及營建領域之資訊檢索技術為出發點,目的在研究過程中找出本領域文件之特徵,並嘗試以領域專業知識協助提升資訊檢索之效能。為此,本研究共分三個主要階段進行:1. 建立特定領域之測試文件集,提供一個評比檢索方法效能的平台,做為發展後續檢索方法的測試基準;2. 由特定領域資訊手冊擷取該領域之知識本體(Ontology),透過權重分析法協助修訂以減輕領域專家投入發展知識本體之工作負荷;3. 以知識本體做為領域知識之來源,研究如何以知識本體協助擷取文件段落(Passage),以文件段落檢索的方式提升特定領域文件檢索之效能,本方法命名為OntoPassage。本論文中將詳述各階段的研究動機、問題發想以及解決方案,一步步建構完成最後文件段落檢索所需的各項資源,除了以實驗的數據佐證OntoPassage可確實提升文件檢索之效能,亦由OntoPassage檢索系統的實作展示OntoPassage具有領域知識特徵之優點。The major purpose of this research is to discover the information retrieval related characteristics of the domain-specifics text documents during the development of the IR models for architecture, engineering and construction domain. The authors proposed a set of research progress to finding the solution to improve the retrieval performance for domain-specific documents, including: a. preparing the testing reference collection to provide a standard platform for evaluating the developed IR models; b. propose a methodology to extract the domain ontology from domain handbooks, and to reduce the work load for participating experts while editing and revising the ontology; c. propose a novel passage retrieval model, named “OntoPassage”, it takes domain ontology to producing concept-oriented passages that could improve the retrieval performance of the domain-specific IR. In the thesis, the research objectives, problems faced and proposed solutions of each progress were discussed separated in independent chapters. The experiment results showed the OntoPassage could highly improve the retrieval performance. OntoPassage retrieval system also demonstrates the potential success of learning and sharing the domain knowledge by using the concept-oriented retrieval scenario.誌謝 I要 III要 IIIbstract IV錄 V目錄 VIII目錄 XI一章、緒論 1-1 研究背景與動機 1-2 研究範圍及目的 7-3 研究方法及步驟 9-4 論文架構 11二章、特定領域之資訊檢索 13-1 建立特定領域之測試文件集 14-1-1 選擇及準備文件 15-1-2 定義資訊需求 17-1-3 評估文件相關度 19-1-4 測試文件集各項屬性說明 23-2 效能測試及實驗步驟 25-3 跨語言資訊檢索之應用 28-3-1 跨語言資訊檢索之目的 28-3-2 以機器翻譯實現特定領域中英文跨語言資訊檢索 30-3-3 實驗結果與分析 37-4 小結 47三章、建立特定領域之知識本體 49-1 知識本體簡介 50-2 由特定領域之手冊擷取知識本體 54-2-1 建置專業辭典 57-2-2 建立階層以及關聯性 59-2-3 定義概念地圖 64-2-4 以權重分析協助修訂 68-2-5 轉換為OWL 73-3 知識本體之評估與檢驗 75-4 小結 79四章、以知識本體為基礎之文件段落擷取與檢索 81-1 文件段落擷取與檢索 83-2 OntoPassage段落擷取模型 88-2-1 OntoPassage段落擷取概念與操作流程 88-2-2 實際範例:NCREE Collection 95-3 效能評估與實驗結果 98-4 OntoPassage檢索系統之展示 103-4-1 概念式檢索情境 104-4-2 系統架構 105-4-3 系統展示 107-4-4 檢索情境效能評估 113-5 小結 115五章、結論及建議 117-1 結論 117-2 未來研究方向建議 121考文獻 123錄A - 地震工程知識管理專家座談會 138錄B - 地震工程領域資訊檢索-搜尋結果評估表 140人簡歷 1434783923 bytesapplication/pdfen-US資訊檢索知識本體文件段落檢索知識管理搜尋引擎測試文件集Information RetrievalOntologyPassage RetrievalKnowledge managementSearch EngineReference Collection以知識本體為基礎之特定領域文件段落擷取方法及應用An Ontology-based Passage Retrieval Method and Application for Domain-Specific Documentsthesishttp://ntur.lib.ntu.edu.tw/bitstream/246246/187867/1/ntu-98-D93521003-1.pdf