「台大核心研究群」計畫【基於學習之適應性分組檢定與資料擷取】

2017-07-012024-05-17https://scholars.lib.ntu.edu.tw/handle/123456789/681883摘要：本子計畫之目標為探索並發展以機器學習為基礎進行適應性分組檢定與資料擷取的演算法。分組檢定之目的在於將大型資料庫中具備某些性質之資料擷取出來，其方式是採用群組採樣，若其中有至少一個具備該性質，該次採樣即為陽性，否則為陰性。如若量測技術更佳，則可得到各採樣群中關於該性質之統計數據。傳統分組檢定技術所適用之數據需具備稀疏性質，方可在遠小於資料庫大小的採樣次數下將具備該性質的稀疏資料擷取出來。然若資料不具備稀疏性，使用傳統分組檢定技術將無法有效減低採樣複雜度。在本子計畫中，我們提出一個基於機器學習的適應性分群檢定與資料擷取的新架構，希望在不具備資料稀疏性的假設之下，結合半監督式學習與分組檢定，將採樣與運算複雜度同時降低「台大核心研究群」計畫【基於學習之適應性分組檢定與資料擷取】