Study of Predictor Weighted Importance under Low-Rank Condition
Date Issued
2016
Date
2016
Author(s)
Chen, Shang-Feng
Abstract
變數重要性 ( Predictor Importance ) 指的是在複迴歸模型中,個別獨立變數對相依變數所發揮的解釋能力,而根據Johnson(2004)對變數重要性的定義,變數重要性同時須考慮獨立變數獨自對相依變數的解釋能力,以及在模型中與其他獨立變數共同解釋時所發揮的解釋能力,然而後者的效果由於獨立變數間往往存在複雜的共線性問題,所以使得變數重要性無法明確地衡量。 在變數重要性的相關文獻中已提出多種評斷變數重要性的方法,但能對共線性問題提出合理解釋與解決方法的目前有兩個主要指標,分別是Budescu(1993)的Dominance Index與Johoson(2000)的Relative Weight,這兩個指標已經經過許多文獻的探討與實例的分析,尤其Dominance Index發展較早,具有明確的解釋意義,被視為變數重要性研究最具參考性指標。 然而目前變數重要性的相關研究,都是樣本數充足的前提下進行討論,也就是假設獨立變數間為線性獨立 ( linear independent ) ,因此本研究的主要目的為分析Dominance Index與Relative Weight在獨立變數間為線性相依下 ( linear dependent ),是否還能夠合理的反映變數重要性,而本文首先將模擬出含有三個獨立變數的線性相依案例,並說明在此模擬案例中合理的變數重要性為何,接著指出幾個Dominance Index 與Relative Weight在獨立變數為線性相依時的不合理之處。 基於Dominance Index與Relative Weight在線性相依案例下皆無法合理反映出變數重要性,本文提出變數加權重要性 ( Predictor Weighted Importance ) 來改進原先變數重要性指標在線性相依案例下之表現,主要概念是將原先之線性相依案例,轉化為多個線性獨立的sub case,計算出各sub case的變數重要性後,再決定各個sub case的計算權重,將各sub case之變數重要性進行加權總合得到變數加權重要性,本文將以此方法建立Weighted Dominance Index與Weighted Relative Weight,並以較複雜之模擬案例及實際案例來進行變數重要性以及使用採用不同模型權重之變數加權重要性的效果比較。
Subjects
Predictor Importance
Weighted Predictor Importance
Type
thesis
