https://scholars.lib.ntu.edu.tw/handle/123456789/14517
標題: | 詞彙語意關係之自動標注─以中英平行語料庫為基礎(2/3) | 作者: | 高照明 | 關鍵字: | 詞彙語意;自動標注;平行語料庫 | 公開日期: | 28-二月-2005 | 出版社: | 臺北市:國立臺灣大學外國語文學系暨研究所 | 摘要: | 本計畫希望利用中英平行語料裡英文的句法結構與中英文詞彙知識庫發展一個 能夠自動標示中文詞彙語意關係的系統。英文方面我們將利用現有的英文詞類標 注程式(Brill1997)句法剖析器 (Link Parser, Cass Parser),英文詞彙知識庫 (Wordnet),英文語法資料庫 (Comlex)。中文方面我們將利用中研院詞庫小組 的分詞與詞類標記程式及中文語法資料庫,董振東先生的知網(Hownet)及訊息結 構,同義詞詞林,教育部國語會國語辭典等資源。首先我們將中英文文件分句。 接著將中文文件分詞與標記詞類。透過電子辭典與統計的訊息,我們可以得到部 分詞彙對應及句子對應的關係。藉由這些訊息與英文的語法結構,我們可以推斷 中文詞組的界限。一旦詞組的界限找到,我們將結合英文對應詞在Wordnet 之間 的詞彙語意關係,中文知網(Hownet),訊息結構,與中研院詞庫小組的中文語法 資料庫確定詞組內詞彙之間的關係究竟是下列哪一種關係,(一)謂語與論元關 係(二)主語與謂語關係(三)上下位關係(四)部件與整體關係(五)同義關 係(六)反義關係等。由於文章通常都圍繞在某一主題,相關的詞彙常會一再出 現,透過詞在篇章裡的訊息及Hownet 與同義詞詞林我們可以進一步確定出這些 詞的關係。 |
URI: | http://ntur.lib.ntu.edu.tw//handle/246246/10169 | 其他識別: | 922411H002061 | Rights: | 國立臺灣大學外國語文學系暨研究所 |
顯示於: | 外國語文學系 |
檔案 | 描述 | 大小 | 格式 | |
---|---|---|---|---|
922411H002061.pdf | 1.12 MB | Adobe PDF | 檢視/開啟 |
在 IR 系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。