2023-01-012024-05-13https://scholars.lib.ntu.edu.tw/handle/123456789/653550類別比例失衡資料分析一直是巨大的挑戰,特別在資料收集可能偏誤、比例失衡時,資料量多與模型有效並不能劃上等號。當弱勢類別樣本數遠低於強勢類別樣本數時,此失衡狀態將導致模型失效。尤其是以準確度為分類目標的模型,很容易被訓練成一味判斷強勢類別的分類器,然而弱勢類別樣本往往才是最需要被檢測和控制的事件,例如信用卡交易欺詐和瑕疵品。傳統方法多從資料預處理生成和代價敏感演算法兩個角度來切入,且缺乏系統化的解決框架。類別比例失衡資料;失衡度評估;自適應資料增強;合成弱勢類別上抽樣 (SMOTE);變分自動編碼器 (VAE);對抗生成網路 (GAN);分類感知特徵萃取;失衡度整合代價敏感演算法;集成式學習;imbalanced data; imbalance evaluation; adaptive data augmentation; Synthetic Minority Oversampling TEchnique (SMOTE); Variational AutoEncoder (VAE); Generative Adversarial Network (GAN); classification-aware feature; imbalance-accommodated cost-effective國立臺灣大學學術研究生涯發展計畫-桂冠型研究計畫【發展分類感知之特徵萃取與自適應資料增強技術以分析類別比例失衡資料】