9. 在建構以距離為基礎的機器學習模型(如 KNN、SVM)時,下列哪一項資料前處理方式最為關鍵?
(A)進行特徵縮放(Feature Scaling),使各特徵變數具有相似的數值範 圍;
(B)將連續型特徵變數轉換為類別型變數;
(C)以平均值或中位數進行缺失值補齊;
(D)進行隨機抽樣以平衡資料筆數

答案:登入後查看
統計: A(8), B(1), C(0), D(1), E(0) #3774683

詳解 (共 2 筆)

#7285364
正確答案是 (A)。 簡要說明:在 K...
(共 116 字,隱藏中)
前往觀看
1
0
#7372236
問題: 如果特徵的數值範圍差異巨大(例如:特徵A是年齡 0-100,特徵B是收入 0-1,000,000),數值範圍大的特徵會主導距離計算,導致數值範圍小的特徵影響力被忽略。解決: 透過特徵縮放(如標準化 Standardization 或歸一化 Normalization),將所有特徵調整到相近的數值區間,確保每個特徵對模型距離計算的貢獻是平等的。
0
1