11. 某團隊為電信公司建立用戶月租方案續約預測模型,資料集包含兩個類別特徵: 「客服評價」共有 5 個等級(非常不滿意至非常滿意),具明確順序關係;「居住縣市」共有 22 個不同類別,類別之間無順序關係。團隊計劃分別以 Logistic Regression 與 XGBoost 訓練模型,並對上述特徵進行編碼。請問下列哪個編碼方案最適當?
(A)兩模型皆將「客服評價」與「居住縣市」進行 One-Hot Encoding,保留全部欄位並使用相同特徵矩陣訓練模型;
(B)Logistic Regression 將「客服評價」做 Ordinal Encoding、「居住縣市」以歷史續約率 進行編碼且於資料切分前計算;XGBoost 對兩個特徵皆採 Ordinal Encoding 處理;
(C)Logistic Regression 將「客服評價」做 Ordinal Encoding、「居住縣市」進行 One-Hot Encoding 並採 Drop First;XGBoost 將「客服評價」採 Ordinal Encoding,「居住縣市」 以類別型態輸入並啟用 enable_categorical;
(D)兩個模型均將「客服評價」以平均續約率進行編碼,「居住縣市」先做 One-Hot Encoding 再以 PCA 降維,並統一作為兩模型輸入特徵

答案:登入後查看
統計: 尚無統計資料