項潔臺灣大學:資訊工程學研究所曾開昱Tseng, Kai-YuKai-YuTseng2007-11-262018-07-052007-11-262018-07-052006http://ntur.lib.ntu.edu.tw//handle/246246/54025對部分特定領域,缺字問題向來是令人頭痛的問題;這是由於中文漢字的特性所造成,中文漢字往往會隨時空環境而不斷地在字音、字形、字意上作改變進而產生許多的新字,致使系統內碼中無法包含所有的中文漢字。這個問題在古代文獻典籍的數位化中尤其嚴重。 本論文探討可攜式字集資源架構[5][15]在缺字問題解決上的優缺點,特意著重其原始架構中二個缺點的改進:第一、使未安裝應用程式的使用者能正常地瀏覽網頁中的缺字,透過字形繪圖伺服器,將網頁中的缺字轉換成圖像檔以供未安裝應用程式的使用者瀏覽缺字;第二、使缺字的輸入更為直覺和簡單,提供缺字輸入工具,使得使用者在輸入缺字時,不再需要先切換到正確的字型(字集),再輸入缺字對應的輸入法鍵串。透過改善可攜式字集資源架構的不足之處,提出解決更為全面的方案。如此一來,未安裝應用軟體的使用者也可以正常地瀏覽缺字文件,而安裝軟體後的使用者在編輯缺字文件上更為容易上手,再加上可攜式字集易於傳播的特性且支援各式支援字型的應用程式,使得缺字處理更為完備。In many digital archive programs that store content like Chinese ancient books, the missing character problem which occurs when one cannot find the intended characters in computer's character set, is always a serious issue. Although certain solutions have been proposed to solve this problem, when it comes to Web publishing, these solutions do not comprehensively address this issue. This paper focuses on the technical approaches to display, input missing characters using Prtable Word Set Resource. Using these approaches, we have successfully created a system that solves the missing character problem.摘要 I 目次 V 第一章 緒論 1 第一節 問題陳述 1 第二節 研究目的 3 第二章 文獻分析 5 第一節 中文系統介紹 5 第二節 問題分析 8 第三節 現行的缺字解決方法 12 第四節 可攜式文字集架構 17 第三章 可攜式文字集架構中缺字處理之改進 24 第一節 網頁的缺字呈現 25 第二節 缺字的輸入 30 第四章 系統缺字處理及應用 35 第一節 缺字處理流程 35 第二節 缺字資訊的交換 41 第三節 CNS11643全字庫可攜式文字集 43 第五章 結論及未來研究方向 49 第一節 結論 49 第二節 未來研究方向 50 參考書目 511440362 bytesapplication/pdfen-US缺字可攜式字集missing wordportable word set可攜式字集資源的缺字呈現與輸入問題Presenting and Inputting of Missing Characters using Portable Word Set Resourcethesishttp://ntur.lib.ntu.edu.tw/bitstream/246246/54025/1/ntu-95-R93922114-1.pdf