32. 某銀行建置貸款違約預測模型，資料共 50,000 筆，其中違約樣本僅 800 筆(佔 1.6%) 。在模型建置流程中，先對整體資料使用 SMOTE 對少數類進行過採樣，之後再進行訓練／測試切分，並訓練輕量梯度提升機(LightGBM)模型，並以 AUC-ROC 評估模型表現。模型在測試集的 AUC-ROC 達到 0.91，團隊認為模型表現良好，準備上線部署。在模型審查過程中，下列何者為使測試集評估結果失真的主要原因？
(A)SMOTE 不適合用於金融違約預測場景，此類高風險業務應一律採用 class_weight 調整損失函數，而非對資料本身進行過採樣；
(B)SMOTE 的過採樣操作在訓練/測試切分之前即對全體資料執行，導致合成樣本資訊洩漏至測試集，使 AUC-ROC 0.91 虛高而不可信；
(C)AUC-ROC 在 1.6%的不平衡場景下過度樂觀，應改用 PR-AUC 作為評估指標，其餘流程均正確；
(D)LightGBM 本身已內建處理不平衡的機制，與 SMOTE 同時使用會造成少數類過度補償，導致過多誤判

答案：登入後查看
統計： A(0), B(4), C(0), D(0), E(0) #3934393

相關試題

33. 某線上書店希望建立一個多類別書籍推薦模型，根據讀者的「年齡、性別、過去購書類別偏好評分」等特徵，預測讀者下次最可能購買的書籍主題(共 8 類) 。資料已完整標註，且資料量達數十萬筆。在模型選型上，除了預測準確率外，也需考量模型訓練效率、可擴充性，並需支援快速訓練與線上部署。請問下列哪種方法最適合此情境？ (A)多類別羅吉斯迴歸(Multinomial Logistic Regression)； (B)支援向量機(SVM)搭配 One-vs-One； (C)K-means 分群後將群集標籤作為分類結果； (D)主成分分析(PCA)後再以最大主成分作為分類依據

34. 某電商平台希望建立二元分類模型，根據商品的「價格區間、品牌、顏色、材質」等特徵，將商品分類為「高銷量(1)」或「低銷量(0)」。同時希望模型輸出具備可解釋的機率(如 P=0.73 表示 73%機率為高銷量)。請問下列哪種方法最適合？ (A)K-means 分群(K-means Clustering)； (B)決策樹迴歸(Decision Tree Regression)； (C)羅吉斯迴歸(Logistic Regression)； (D)線性迴歸(Linear Regression)

35. 某工程師在開發一個以 Transformer 為基礎的文本分類模型時，發現模型對於詞語順序的變化不夠敏感，影響語意判斷效果。請問在 Transformer 架構中，位置編碼(Positional Encoding)的主要作用為何？ (A)在詞嵌入(Embedding)中加入隨機擾動，以提升模型對輸入變化的泛化能力； (B)在注意力機制中加入遮罩(Mask)，限制模型只能關注部分詞語； (C)將輸入序列轉換為可同時運算的向量表示，以提升計算效率； (D)在詞的向量表示中加入位置資訊，使模型能區分序列中不同位置的詞語

36. 某 AI 系統架構師正在為一個電子商務資料湖(Data Lake)設計系統。該資料湖儲存數百億筆使用者點擊紀錄，並作為企業主要的分析資料來源。系統需讓非技術背景的行銷人員能以自然語言查詢數據洞察(如：上個月台北市購買 3C 產品的女性轉換率為何？) ，同時滿足高精確性、可擴展性，支援資料庫層級的權限控管與查詢審計，並確保查詢結果可由資料庫引擎精確執行。在此情境下，下列何者為最適合的系統架構？ (A)協同過濾(Collaborative Filtering) ：根據歷史查詢推薦相似問題的答案，無法執行新問題的即時計算； (B)檢索增強生成(RAG) ：讓 LLM 檢索相關資料後生成回答，但無法可靠執行大規模數值聚合與精確統計查詢； (C)生成對抗網路(GAN) ：用於生成合成資料或模擬數據分佈，可用於資料擴增，但不適合即時查詢與資料庫聚合運算； (D)Text-to-SQL Agent：由 LLM 將自然語言轉換為 SQL 查詢，交由分散式資料庫執行，兼顧自然語言彈性與資料查詢精確性

37. 某金融機構將訓練好的信用評分模型開放 API 供合作夥伴查詢。資安團隊警告此設計可能遭受成員推斷攻擊(Membership Inference Attack) 。下列何者最準確說明攻擊原理與對應防禦？ (A)利用模型對訓練樣本的高信心輸出判斷其是否屬於訓練集；以差分隱私或降低輸出信心防禦； (B)利用查詢次數與回應頻率差異判斷資料是否在訓練集中；以限制查詢次數防禦； (C)透過模型輸出推測輸入的敏感特徵；以限制輸出資訊防禦； (D)透過大量查詢建立替代模型模擬目標模型；以限制模型存取防禦

38. 某 AI 平台的資料治理工程師正在評估三種去識別化技術的適用場景與強度：K 匿名 (K-anonymity)、差分隱私合成資料(Differential Privacy Synthetic Data)、亂數回應機制(Randomized Response)。下列敘述何者不正確？ (A)K 匿名主要應用於表格型資料，確保每筆記錄在準識別符(Quasi-identifier)組合上至少與 K-1 筆其他記錄相同，防止個體被唯一識別； (B)差分隱私合成資料是在發布統計查詢結果或訓練模型時直接對原始資料加入雜訊，以確保單一個體的加入或移除不會顯著改變輸出； (C)亂數回應機制讓受訪者以機率性方式回答敏感問題(如：您是否曾逃稅？) ，賦予個人對答案的可否認性(Plausible Deniability)； (D)三種技術中，只有差分隱私提供可組合且可量化的隱私保證，而 K 匿名與亂數回應在面對背景知識攻擊或多次查詢時保護能力有限二、程式題

39. 在建構自動化資料清洗管線時，工程師撰寫一個用於補齊缺失欄位的 Python 函式，如下圖所示。當此函式連續處理兩筆獨立的資料(row1 與 row2)後，請問第二筆資料 row2['tags']的內容會為何？ (A) ["checked", "tags"]； (B) []； (C) ["checked", "checked"] ； (D) 拋出 KeyError 錯誤，因為字典中沒有 tags 鍵值

40. 下圖為一段分類演算法的 pseudocode，請問最可能對應下列哪一種演算法？(A) K-近鄰(K-Nearest Neighbors, KNN)； (B) K-means 分群(K-means Clustering)； (C)支援向量機(Support Vector Machine, SVM)； (D)隨機森林分類器(Random Forest Classifier)

41. 請問下列哪一種處理方式最為合理？ (A) df['daily_earnings'].fillna(df['daily_earnings'].mean(), inplace=True)； (B) df['daily_earnings'].fillna(df['daily_earnings'].median(), inplace=True)； (C)df['daily_earnings'].fillna(df['daily_earnings'].max(), inplace=True)； (D)直接刪除所有遺失資料，因數值型欄位不適合進行補值處理承上題，團隊在建立預測模型前，先將 region(A、B、C 區)轉換為整數 1、2、3，

42. 承上題，團隊在建立預測模型前，先將 region（A、B、C 區）轉換為整數 1、2、3，即採用標籤編碼(Label Encoding) 。模型上線測試後發現，線性迴歸模型對於 C 區(編碼為 3)的預測收入出現明顯高估，顯示模型可能將編碼值誤解為具有線性大小關係。若主管要求不得修改原有的特徵編碼方式，必須維持 1、2、3 的整數表示，但希望從演算法層面降低此類誤解風險，則下列何者最適合作為替代模型？ (A)羅吉斯迴歸(Logistic Regression)； (B)Ridge 迴歸(Ridge Regression)； (C)支援向量機(Support Vector Machine, SVM)搭配線性核函數； (D)隨機森林(Random Forest)

相關試卷

115年 - 115-1 AI應用規劃師_中級能力鑑定公告試題_第三科：機器學習技術與應用#141075

2026 年 · #141075

115年 - 115-1 中級AI應用規劃師試題_第二科：大數據處理分析與應用#141063

2026 年 · #141063

115年 - 115-1中級AI應用規劃師公告試題_第一科：人工智慧技術應用與規劃_#141062

2026 年 · #141062

114年 - 114-2 AI 應用規劃師-中級能力鑑定公告試題_第三科：機器學習技術與應用#136329

2025 年 · #136329

114年 - 114-2 AI 應用規劃師-中級能力鑑定公告試題_第二科：大數據處理分析與應用#136306

2025 年 · #136306

114年 - 114-2 AI 應用規劃師-中級能力鑑定公告試題_一科：人工智慧技術應用與規劃#136301

2025 年 · #136301

114年 - iPAS AI應用規劃師中級能力鑑定-考試樣題(114/09)_科目三：機器學習技術與應用#136300

2025 年 · #136300

114年 - iPAS AI應用規劃師中級能力鑑定-考試樣題(114/09)_科目二：大數據處理分析與應用#136295

2025 年 · #136295

114年 - iPAS AI應用規劃師中級能力鑑定-考試樣題(114/09)_科目一：人工智慧技術應用與規劃#136294

2025 年 · #136294

114年 - iPAS AI 應用規劃師能力鑑定考試樣題(中級)#126106

2025 年 · #126106