7. 貝氏分類器(Naive Bayes Classifier)常被應用於文字分類、垃圾郵件過濾等場景。依據模型特性,它最適合歸類於下列哪一類?
(A)透過直接學習輸入特徵與目標標籤之間的邊界或關係來進行分類的模型;
(B)透過建構資料的整體分布,並利用條件關係進行推斷和分類的模型;
(C)側重探索資料中樣本間的相似性,將資料自動分成不同群組的模 型;
(D)透過試錯學習,根據行動結果的獎勵或懲罰來優化決策策略的模型
統計: A(30), B(19), C(11), D(0), E(0) #3869550
詳解 (共 1 筆)
這題的正確答案是 (B) 透過建構資料的整體分布,並利用條件關係進行推斷和分類的模型。
以下是針對每個選項的機器學習概念解析:
-
✅ (B) 是正確的(生成模型 Generative Model): 貝氏分類器(Naive Bayes)是一種典型的生成模型。它的核心原理是基於「貝氏定理(Bayes' Theorem)」,先去學習資料在各個類別下的聯合機率分布或條件機率(例如:給定是一封垃圾郵件的條件下,出現「免費」這個詞的機率是多少),然後再綜合先驗機率,去反向推斷新資料屬於哪個類別的機率。選項 B 的描述完美契合這個機制。
-
❌ (A) 是錯誤的(判別模型 Discriminative Model): 這個選項描述的是判別模型。這類模型(例如:邏輯迴歸 Logistic Regression、支援向量機 SVM、決策樹 Decision Tree)並不會去管資料整體的機率分布長怎樣,而是直接去尋找一條能夠把不同類別切開的「決策邊界(Decision Boundary)」。
-
❌ (C) 是錯誤的(分群 Clustering): 這個選項描述的是非監督式學習中的分群演算法(例如:K-means、DBSCAN)。它們不依賴預先標註好的標籤,而是單純看特徵的相似度來將資料分堆。貝氏分類器屬於監督式學習,必須要有標註好的歷史資料(如標記好是/否為垃圾郵件)才能進行訓練。
-
❌ (D) 是錯誤的(強化學習 Reinforcement Learning): 這個選項描述的是強化學習(例如:AlphaGo 的底層演算法、Q-Learning)。這是一種透過在環境中不斷「試錯(Trial and Error)」,並根據獲得的獎勵(Reward)或懲罰(Penalty)來學習最佳策略的機制,完全不是貝氏分類器的工作方式。