詞彙語意關係之自動標注─以中英平行語料庫為基礎(2/3)
Date Issued
2005-02-28
Date
2005-02-28
Author(s)
DOI
922411H002061
Abstract
本計畫希望利用中英平行語料裡英文的句法結構與中英文詞彙知識庫發展一個
能夠自動標示中文詞彙語意關係的系統。英文方面我們將利用現有的英文詞類標
注程式(Brill1997)句法剖析器 (Link Parser, Cass Parser),英文詞彙知識庫
(Wordnet),英文語法資料庫 (Comlex)。中文方面我們將利用中研院詞庫小組
的分詞與詞類標記程式及中文語法資料庫,董振東先生的知網(Hownet)及訊息結
構,同義詞詞林,教育部國語會國語辭典等資源。首先我們將中英文文件分句。
接著將中文文件分詞與標記詞類。透過電子辭典與統計的訊息,我們可以得到部
分詞彙對應及句子對應的關係。藉由這些訊息與英文的語法結構,我們可以推斷
中文詞組的界限。一旦詞組的界限找到,我們將結合英文對應詞在Wordnet 之間
的詞彙語意關係,中文知網(Hownet),訊息結構,與中研院詞庫小組的中文語法
資料庫確定詞組內詞彙之間的關係究竟是下列哪一種關係,(一)謂語與論元關
係(二)主語與謂語關係(三)上下位關係(四)部件與整體關係(五)同義關
係(六)反義關係等。由於文章通常都圍繞在某一主題,相關的詞彙常會一再出
現,透過詞在篇章裡的訊息及Hownet 與同義詞詞林我們可以進一步確定出這些
詞的關係。
Subjects
詞彙語意
自動標注
平行語料庫
Publisher
臺北市:國立臺灣大學外國語文學系暨研究所
Type
report
File(s)![Thumbnail Image]()
Loading...
Name
922411H002061.pdf
Size
1.09 MB
Format
Adobe PDF
Checksum
(MD5):8758ac011f9d47568b21d5870912addf
