35. 某生物醫學研究機構正在建構一個整合「基因序列特徵」與「電子病歷文本特徵」 的疾病風險預測模型。由於高維數值特徵和語意文本特徵的性質差異顯著,請問 下列哪一種特徵處理與選擇策略最為合適?
(A)將所有特徵合併為單一特徵矩陣後,使用主成分分析(PCA)進行降維,作為 模型輸入;
(B)採分層策略,先對基因序列特徵進行特徵選擇,再對文本特徵進行語意表示, 最後將兩類特徵融合(Feature Fusion)後輸入模型;
(C)將所有特徵合併後,使用隨機森林(Random Forest)的特徵重要性進行一次性 排序與篩選;
(D)將文本特徵轉換為簡單統計特徵(如詞頻)後與基因特徵一併建模,以降低特 徵處理複雜度

答案:登入後查看
統計: 尚無統計資料