項潔臺灣大學:資訊工程學研究所陳榮佐Chen, Rung-TzuoRung-TzuoChen2007-11-262018-07-052007-11-262018-07-052006http://ntur.lib.ntu.edu.tw//handle/246246/53800隨著網路的蓬勃發展,色情網站的數量也與日劇增,人們也開始重視色情網站的問題,然而,想要獲得色情網站的數量並不是件簡單的事。本篇論文試著提出一個評估色情網站的方法,並擁有一定的信心值與誤差。 為了建立一套系統化且擁有較高信賴度的方法,我們採用網路位置(IP Address)取代以往以網域名稱(domain name)或網頁(webpage)來當作色情網站的單位,而我們使用關鍵字(keyword)、資料庫比對(database match)、鏈結分析(link analysis)來判斷是否為色情網站,再配合簡單隨機抽樣(Simple Random Sampling)來推得共有 69077個網路位置為色情網站,擁有95%信心值,誤差10%。It is known that the number of pornographic websites increases as the Web expands. To estimate this number of pornographic websites online remains a big challenge. This paper proposes a method, based on statistical approaches, to estimate the actual number of pornographic websites within a certain confidence interval, and error range. In order to develop a more systematic and reliable method to estimate the number of pornographic websites, we have chosen to use IP address as our unit of measurement instead of the more commonly used domain name and webpage to describe pornographic website. We have used keywords, database matches, and link analysis to determine if a website contains pornographic content or not. Based on Simple Random Sampling statistics, we have concluded the number of pornographic websites up to date is 69077 with 95% confidence interval and within 10% error.目錄 1 第一章 緒論 3 1.1 研究背景 3 1.2 研究動機 6 1.3 研究目標 7 1.4 論文架構 7 第二章 文獻探討與相關軟體研究 9 2.1 相關軟體研究 9 2.1.1 費爾網路監護專家 9 2.1.2 @INFilter Solution 濾巨人 10 2.1.3 Norton Internet Security – Parental Control 11 2.1.4 N2H2 – Sentian 12 2.1.5 綜合比較 13 2.2 相關文獻 14 2.3 常見判斷色情資訊的方式 21 第三章 事前準備與演算法 23 3.1如何判定色情網站 23 3.2挑選評估單位 24 3.2.1 以網頁為單位 24 3.2.2 以網域名稱為單位 26 3.2.3 以網路位置為單位 29 3.2 簡單隨機抽樣法(Simple random sampling) 30 3.3 評估方法及其概述 31 第四章 實作步驟與數據 32 4.1 建立資料庫 32 4.1.1 建立網域名稱資料庫 32 4.1.2 建立網域名稱關鍵字資料庫 32 4.1.3 建立網路位置資料庫 32 4.2 實作步驟 32 4.2.1 系統架構圖與原件 32 4.2.2 流程說明 32 4.3 實驗數據與分析 32 第五章 結論及未來工作 32 5.1 結論 32 5.2 未來工作 32 參考文獻 321286219 bytesapplication/pdfen-US色情網站網站數量評估網站單位pornographic websitesEstimating the Number of Topic Specific Websites網路位置為基礎的網站數量評估機制 -以色情網站為例Estimating the Number of Topic Specific Websites Based on IP Address-Using Pornographic Websites as An Examplethesishttp://ntur.lib.ntu.edu.tw/bitstream/246246/53800/1/ntu-95-R93922090-1.pdf