42. 承上題,團隊在建立預測模型前,先將 region(A、B、C 區)轉換為整數 1、2、3,即採用標籤編碼(Label Encoding) 。模型上線測試後發現,線性迴歸模型對於 C 區(編碼為 3)的預測收入出現明顯高估,顯示模型可能將編碼值誤解為具有線性大小關係。 若主管要求不得修改原有的特徵編碼方式,必須維持 1、2、3 的整數表示,但希望從 演算法層面降低此類誤解風險,則下列何者最適合作為替代模型?
(A)羅吉斯迴歸(Logistic Regression);
(B)Ridge 迴歸(Ridge Regression);
(C)支援向量機(Support Vector Machine, SVM)搭配線性核函數;
(D)隨機森林(Random Forest)
答案:登入後查看
統計: 尚無統計資料
統計: 尚無統計資料