44. 研究人員撰寫的程式中(下圖),先用整體資料進行 LDA(Linear Discriminant Analysis)降維,接著再用 KNN(K-Nearest Neighbors)進行分類,並用交叉驗證來評估準確率。請問下列敘述何者正確?
(A)此寫法完全正確,因為先以整體資料進行 LDA 降維,再以交叉驗證測試 KNN, 是標準流程;
(B)此寫法存在資料洩漏(Data Leakage)問題,應將 LDA 納入交叉驗證流程中一 併進行;
(C)雖然流程不夠嚴謹,但結果仍然能夠代表模型真實的泛化能力;
(D)如果只想驗證 KNN 的分類效果,可以直接跳過 LDA 步驟,以簡化流程
答案:登入後查看
統計: 尚無統計資料
統計: 尚無統計資料