32. 某銀行建置貸款違約預測模型,資料共 50,000 筆,其中違約樣本僅 800 筆(佔 1.6%) 。 在模型建置流程中,先對整體資料使用 SMOTE 對少數類進行過採樣,之後再進行訓 練/測試切分,並訓練輕量梯度提升機(LightGBM)模型,並以 AUC-ROC 評估模型 表現。模型在測試集的 AUC-ROC 達到 0.91,團隊認為模型表現良好,準備上線部署。 在模型審查過程中,下列何者為使測試集評估結果失真的主要原因?
(A)SMOTE 不適合用於金融違約預測場景,此類高風險業務應一律採用 class_weight 調 整損失函數,而非對資料本身進行過採樣;
(B)SMOTE 的過採樣操作在訓練/測試切分之前即對全體資料執行,導致合成樣本資訊 洩漏至測試集,使 AUC-ROC 0.91 虛高而不可信;
(C)AUC-ROC 在 1.6%的不平衡場景下過度樂觀,應改用 PR-AUC 作為評估指標,其餘 流程均正確;
(D)LightGBM 本身已內建處理不平衡的機制,與 SMOTE 同時使用會造成少數類過度 補償,導致過多誤判
答案:登入後查看
統計: 尚無統計資料
統計: 尚無統計資料