指導教授:陳凱儀臺灣大學:農藝學研究所李欣叡Lee, Shin-RueiShin-RueiLee2014-11-302018-07-112014-11-302018-07-112013http://ntur.lib.ntu.edu.tw//handle/246246/263766基因組選種 (genomic selection) 是新興的分子標記輔助選種策略,透過由訓練族群所建構的統計預測模型,直接以個體大量的分子標記基因型資料計算各個個體的個體育種價估計值,並以此為依據選拔個體。已知預測模型的統計方法、分子標記數量以及訓練族群大小,皆會影響個體育種價估計值的預測準確度。本研究挑選計算能力優異的RR-BLUP、BL與RKHS三種統計方法建構預測模型,並依據有效基因座數目、訓練族群大小、分子標記數量、和性狀狹義遺傳率等四種參數的不同設定,模擬192種不同水稻重組自交系訓練族群的基因型與外表型的資料。然後計算192種組合模擬資料之三種統計模型的預測準確度,評估與比較各種參數設定對預測準確度的影響,以決定投入訓練族群之試驗規模。評選方法是依據不同的狹義遺傳率,先選取基因組選種之預測準確度可高於外表型選種的所有組合,再由這些組合中選出最小訓練族群大小且最少分子標記數量的組合。Genomic Selection is a new strategy of marker-assisted selection that selects superior individuals based on their genomic estimated breeding values. The genomic estimated breeding values are calculated solely using individual genotypes of substantial markers through a statistical prediction model built by data collecting from a training population. Prediction accuracy of genomic estimated breeding values can be affected by several factors, including statistical methods of the prediction model, number of markers genotyped, and size of the training population. In the current study, three statistical methods – RR-BLUP, BL, and RKHS – all of which have great computing ability were chosen to establish the prediction model. 192 different sets of genotypic and phenotypic data of rice recombinant inbred populations were simulated in silico as training populations among which effective QTL numbers, population size, marker numbers, and narrow-sense heritability were assigned at different levels. In order to determine the most effective inputs of a training population for given narrow-sense heritability of a characteristics, prediction accuracy of genomic estimated breeding values was calculated and compared for all simulated training populations using the three statistical methods. At each different level of narrow-sense heritability, sets of training populations showing that genomic selection is more effective than phenotypic selection were identified, and then the set with lowest marker numbers and smallest size of the training population were selected.目錄 口試委員會審定書 i 誌謝 ii 摘要 iii Abstract iv 目錄 v 表目錄 vii 圖目錄 viii 中英對照表 ix 一、 前言: 1 1.1 簡介基因組選種 1 1.2 影響選拔效率因子 3 1.3 基因組選種研究近況 4 二、研究目的: 9 三、材料與方法: 10 3.1 試驗資料的模擬 10 3.1.1 基因型資料模擬 10 3.1.2 外表型資料模擬 11 3.2 建立預測模型 12 3.2.1 RR-BLUP 12 3.2.2 Bayesian LASSO 13 3.2.3 RKHS 13 3.3 預測準確度與交互驗證法 14 3.4 變方分析與特奇顯著差異法 15 四、結果: 16 4.1 外表型模擬結果 16 4.2 三種統計模型比較 16 4.3 不同有效基因座數目結果比較 16 4.4 不同遺傳率結果比較 17 4.5 不同訓練族群大小結果比較 17 4.6 不同分子標記數量結果比較 17 4.7 試驗規模的選擇 17 五、討論: 19 5.1 目標性狀的遺傳率 19 5.2 控制目標性狀的有效基因座個數 19 5.3 建構模型的統計方法 20 5.4 分子標記的數量 21 5.5 訓練族群的大小 22 六、結論 24 七、引用文獻: 45 附錄一、資料模擬及統計預測程式 48 表目錄 表一、基因組選種實證研究整理 25 表一、基因組選種實證研究整理 (續) 26 表一、基因組選種實證研究整理 (續) 27 表二、外表型選種之預測準確度結果 28 表三、基因組選種之RR-BLUP模型預測準確度結果 29 表四、基因組選種BL模型之預測準確度結果 30 表五、基因組選種RKHS模型之預測準確度結果 31 表六、分子標記數目變方分析之機率值,與特奇顯著差異之組別,以BL模型結果計算。 32 圖目錄 圖一、雙指數分佈圖 34 圖二、在不同的有效基因座數目下,100個QTL的遺傳變方大小。 35 圖三、在三種的有效基因座數目設定下,100個QTL效應抽樣結果。 36 圖四、模擬外表型與台南場水稻族群外表型分布圖。 37 圖五、三種統計模型之預測準確度分布圖。為492個分子標記、450個訓練族群大小、5個有效基因座、遺傳率0.3設定狀態下的預測結果。 38 圖六、三種有效基因座數目之預測準確度分布圖。為492個分子標記、225個訓練族群大小、遺傳率0.3設定狀態下的BL模型預測結果。 39 圖七、四種遺傳率下之預測準確度分布圖。為492個分子標記、338個訓練族群大小、10個有效基因座的BL模型預測結果。 40 圖八、四種族群大小之預測準確度分布圖。為252個分子標記、1 0個有效基因座、遺傳率0.3設定狀態下的BL模型預測結果。 41 圖九、四種分子標記數目之預測準確度分布圖。為338個訓練族群大小、3 0個有效基因座、遺傳率0.3設定狀態下的BL模型預測結果。 42 圖十、四種族群大小之預測準確度分布圖。為252個分子標記、1 0個有效基因座、遺傳率0.1設定狀態下的BL模型預測結果。 43 圖十一、四種族群大小之預測準確度分布圖。為252個分子標記、1 0個有效基因座、遺傳率0.5設定狀態下的BL模型預測結果。 44 圖十二、四種族群大小之預測準確度分布圖。為492個分子標記、1 0個有效基因座、遺傳率0.7設定狀態下的BL模型預測結果。 451699051 bytesapplication/pdf論文公開時間:2013/11/05論文使用權限:同意有償授權(權利金給回饋學校)基因組選種預測模型規模選定水稻基因組選種之模擬研究 ── 訓練族群預測模型之建立與最低投入試驗規模之確立Simulation Study of Genomic Selection in Rice: Establishment of Prediction Model and Identification of Minimal Experimental Inputs for the Training Populationthesishttp://ntur.lib.ntu.edu.tw/bitstream/246246/263766/1/ntu-102-R99621110-1.pdf