劉清臺灣大學:農藝學研究所黃齡葦Huang, Lin-WeiLin-WeiHuang2007-11-282018-07-112007-11-282018-07-112005http://ntur.lib.ntu.edu.tw//handle/246246/59138本研究重點為探討拔靴法(bootstrap method)、資料擴增法(data augmentation)與多重插補法(multiple imputation)對遺失資料(missing data)進行區間估計的成效。一般處理遺失值的方式有很多種,但插補法則較多統計學者使用,插補法可分為單一插補法(single imputation)及多重插補法。在早期因為單一插補法較為方便,所以較為多人所使用,而今日許多軟體漸漸提供多重插補法,讓使用者可以爲遺失值填入多個比單一插補法更有效的值。本研究利用模擬資料,同時用三種方法進行平均數的區間估計,以證明多重插補法的參數估計能力,可以達到與拔靴法的同樣效果。 本研究模擬三種型態的多元常態分布資料,並且設定不同的遺失比例,分別進行拔靴法、資料擴增法與多重插補三種方法的信賴區間估計。結果發現拔靴法在信賴區間估計上,無論樣本大小或是遺失資料比例為何,其估計能力都有一定的水準;資料擴增法則是在小樣本的信賴區間估計較大樣本好,但無論遺失比例為何,資料擴增法都是三種方法中出現最多錯誤估算的;多重插補法的估計效果和拔靴法相當,無論樣本大小或是遺失比例為何,信賴區間幾乎都涵蓋母體參數,尤其在遺失比例高達50%時,多重插補法依舊能準確地估計母體參數,顯示多重插補法所產生的參數估計是可以信賴的。The purpose of this study is to compare the difference between the method of bootstrap, a data augmentation and multiple imputation for estimating the confidence interval of missing data. In general, there are several methods dealing with missing data, but imputation method is usually used by statisticians. The imputation method can be divided into single imputation and multiple imputation. In early years, single imputation is more convenient. Now lots of software provides the procedure of multiple imputation. The confidence intervals for mean were established by the three methods. Then we show that the multiple imputation is as efficient as bootstrap method. We simulate data from multivariate normal distribution with three different sample sizes, and set different missing rates it was found that the coverage probability for bootstrap method is approximate to the confidence coefficient. The data augmentation is inferior to both bootstrap method and multiple imputation. The result of the multiple imputation is similar to the bootstrap method. The multiple imputation still estimates the parameters accurately even for high missing rate.摘 要 I ABSTRACT II 目 錄 III 表 目 錄 IV 第一章 前 言 1 第二章 方法介紹 3 第一節 遺失值發生機制 3 第二節 方法介紹 4 第三章 資料模擬與分析 11 第一節 資料模擬 11 第二節 拔靴法求信賴區間 12 第三節 資料擴增法求信賴區間 16 第四節 多重插補法求信賴區間 21 第五節 模擬結果 26 第六節 拔靴法與多重插補法比較 39 第七節 實例分析 42 第四章 結果與討論 44 第一節 研究發現 45 第二節 後續研究建議 46 參考文獻 48 附錄A 平均數信賴區間模擬程式 50 附錄B 共變數矩陣信賴區間模擬程式 531641079 bytesapplication/pdfen-US遺失資料EM法多重插補法拔靴法信賴區間missing dataEM algorithmmultiple imputationbootstrapconfidence interval遺失資料之多重插補法模擬比較研究Simulation Study for Missing Data with Multiple Imputationthesishttp://ntur.lib.ntu.edu.tw/bitstream/246246/59138/1/ntu-94-R92621203-1.pdf