11. 某工程師在 A100 GPU 叢集上訓練大型語言模型，觀察到以下現象：全批次梯度下降時 GPU 利用率達 100%，但每次更新耗時 45 秒；隨機梯度下降(SGD)每次更新僅需 0.01 秒，但梯度極不穩定、訓練曲線震盪劇烈。為兼顧梯度穩定性與 GPU 吞吐量(Throughput)，應採用下列哪種策略？
(A)全批次梯度下降(Full-batch GD)：使用完整資料集計算梯度，更新穩定但每次更新耗時長；
(B)隨機梯度下降(SGD)：每次只用一個樣本，速度快但梯度雜訊大，收斂不穩定；
(C)第二階梯度法(Newton's Method)：利用 Hessian 矩陣精確估計曲率，大幅減少更新次數；
(D)小批次梯度下降(Mini-batch GD)：以適當批次大小(如 256-2048)平衡梯度估計穩定性與 GPU 平行效率，是深度學習的業界標準

答案：登入後查看
統計： A(0), B(0), C(5), D(2), E(0) #3934947

相關試題

12. 某醫院導入肺癌篩檢模型，資料集中正常病例佔 99%、肺癌陽性僅佔 1%。模型上線後，系統報告整體準確率(Accuracy)為 99.1%。醫師對此數字感到疑慮，認為不足以評估臨床價值，在漏診風險上可能存在重大問題。請問在此情境下，僅以 Accuracy 作為評估指標最嚴重的缺陷為何？ (A)Accuracy 對類別不平衡不敏感，可能無法反映模型對肺癌陽性的偵測能力； (B)Accuracy 的計算不包含模型對邊界樣本的分類結果，容易遺漏困難樣本； (C)Accuracy 無法處理多分類問題，在二元分類下需改用 AUC； (D)Accuracy 無法揭示模型的收斂速度，因此不適合用來選擇最終模型

13. 某工程師訓練文本情感分類模型，訓練集 F1=0.96、驗證集 F1=0.71，落差明顯， 115 年第一次 AI 應用規劃師-中級能力鑑定【公告試題】第三科：機器學習技術與應用考試日期：115 年 05 月 23 日第 4 頁，共 18 頁答案題目顯示模型出現過擬合。下列哪一種策略能最直接從降低模型複雜度的角度緩解過擬合？ (A)增加訓練 Epoch 數至 200，讓模型充分學習訓練資料的所有細節； (B)引入更多原始文本特徵(包括原始 URL、HTML 標籤)，增加特徵多樣性； (C)對 Embedding 層與全連結層加入 L2 權重衰減(Weight Decay)，懲罰參數值； (D)移除驗證集並將其併入訓練集，以增加模型可見的訓練樣本數

14. 某電商平台使用樸素貝氏分類器(Naive Bayes Classifier)建立垃圾郵件過濾模型。訓練集準確率(Accuracy)達 92%，但上線後發現，包含「限時優惠、立即下單享折扣」等關鍵字的正常促銷郵件，常被誤判為垃圾信。經分析發現，這些詞彙在訓練資料中多出現在垃圾郵件中，導致其類別條件機率偏高。請問造成此現象的最主要原因與較適當的改善方式為何？ (A)應禁用 Naive Bayes，改用其他更先進演算法； (B)模型過擬合於訓練資料，應增加 Epoch 數以提升泛化能力； (C)類別條件機率受訓練資料分布影響，導致促銷關鍵字被視為垃圾信特徵，應重新平衡資料或調整先驗機率； (D)模型未進行特徵標準化(Feature Scaling)，導致分類邊界偏移，應先進行正規化處理

15. 某資料科學家將客戶資料進行分群，使用 K-means(K=5)後發現部分群集呈現半月形(非凸)結構，且資料中存在少數離群值(Outliers)。他同時觀察到每次執行結果略有不同。下列敘述何者最完整且準確地反映 K-means 在此情境中的已知限制？ (A)K-means 無法處理維度超過 10 的資料，在高維空間中距離計算失效； (B)K-means 假設群集為高斯分佈，無法處理任何非球形群集； (C)K-means 對 K 值敏感，但初始化不影響最終結果(演算法保證全局最優)； (D)K-means 需預先指定 K；以歐氏距離為基礎，難以處理非凸群集；對初始化與離群值敏感

16. 某資料科學家在信用評分任務中使用 XGBoost 建立模型，發現模型在訓練集表現良好但驗證集出現過擬合跡象。他檢視其模型設計，發現 XGBoost 在目標函數 (Objective Function)中引入額外的正則化機制以控制模型複雜度。相較於傳統梯度提升決策樹(GBDT)，XGBoost 在其核心目標函數中加入了下列哪一種關鍵設計，使其具備更強的防過擬合能力？ (A)加入樹的複雜度懲罰項(包含深度、葉節點數量與葉節點權重的 L2 正則化)； (B)加入動態學習率(Dynamic Learning Rate)的強制衰減機制； (C)加入卷積運算(Convolution)以萃取特徵間的空間關係； 115 年第一次 AI 應用規劃師-中級能力鑑定【公告試題】第三科：機器學習技術與應用考試日期：115 年 05 月 23 日第 5 頁，共 18 頁答案題目 (D)強制所有決策樹深度為 1(Decision Stumps)

17. 某醫療新創團隊將原有 3 層 CNN 升級為 16 層架構以提升 CT 影像腫瘤偵測率，但發現訓練損失反而高於 3 層版本且收斂困難。工程師懷疑是網路深度造成的訓練問題，下列診斷與對策何者最正確？ (A)網路層數增加導致參數量過多，應減少每層卷積濾波器(Filters)數量以降低模型複雜度； (B)深層網路可能出現梯度消失問題，導致淺層權重難以更新；應採用 ResNet 的殘差連接(Skip Connection)以改善梯度傳遞； (C)16 層模型對 CT 影像而言仍過淺，應進一步增加網路深度以學習更高階特徵； (D)問題可能來自激活函數(Activation Function)，將 ReLU 改為 Sigmoid 可改善梯度傳遞問題

18. 某工程師設計用於醫療 X 光影像分類的 CNN，發現卷積層後直接接全連結層導致參數量高達 5,000 萬，訓練速度極慢。為降低模型參數量與計算成本，他在卷積層後加入池化層(Pooling Layer)。下列何者為池化層在此設計中最主要解決的問題？ (A)降低特徵圖空間維度，減少參數與計算量； (B)提供非線性表達能力，以提升模型學習複雜度； (C)改善梯度消失問題，以強化反向傳播穩定性； (D)提升模型泛化能力而不影響特徵維度

19. 某團隊開發合約文件審查系統，需比對合約首頁的定義條款與第 20 頁的責任條款是否一致。工程師初版採用雙向長短期記憶(Bidirectional LSTM)，但發現長文件的跨段落語義關聯捕捉效果不佳，且訓練時間隨文件長度明顯增加。改用 Transformer 架構後問題獲得改善，下列何者為最主要的原因？ (A)Transformer 參數量比 LSTM 少，因此訓練速度更快、不易過擬合； (B)Transformer 內建位置編碼，使模型天生理解文件的章節結構與段落順序； (C)LSTM 無法處理超過 512 個 token 的輸入，Transformer 無此硬性限制； (D)Transformer 的 Self-Attention 可讓任意 token 直接建立關聯，不受距離限制，且運算可平行化

20. 工程師在 PyTorch 中建構貓、狗、鳥三分類 CNN，並使用交叉熵損失函數 (CrossEntropyLoss)作為訓練目標。由於此損失函數在內部已包含 Softmax 計算，輸出層的設計需特別注意。請問輸出層的激活函數(Activation Function)與輸出維度應如何設定？ (A)使用 ReLU 作為激活函數，輸出維度設為 1，直接輸出單一數值作為預測結果； (B)使用 Sigmoid 作為激活函數，輸出維度設為 3，使每個類別獨立輸出 0 到 1 的機率； (C)不使用任何激活函數，直接輸出未經正規化的 logits，輸出維度設為 3 對應三個類別； (D)使用 Softmax 作為激活函數，輸出維度設為 3，輸出為已正規化的機率分布

21. 某工程師將一個大型預訓練模型部署至資源受限的行動裝置，發現模型體積過大且推論效率不足。為降低模型大小並提升推論速度，他將原本 32-bit 浮點數權重轉換為 8-bit 整數。在不重新訓練模型的前提下，請問此過程稱為何？ (A)知識蒸餾(Knowledge Distillation)； (B)權重剪枝(Pruning)； (C)張量分解(Tensor Decomposition)； (D)模型量化(Quantization)

相關試卷

115年 - 115-1 AI應用規劃師_中級能力鑑定公告試題_第三科：機器學習技術與應用#141075

2026 年 · #141075

115年 - 115-1 中級AI應用規劃師試題_第二科：大數據處理分析與應用#141063

2026 年 · #141063

115年 - 115-1中級AI應用規劃師公告試題_第一科：人工智慧技術應用與規劃_#141062

2026 年 · #141062

114年 - 114-2 AI 應用規劃師-中級能力鑑定公告試題_第三科：機器學習技術與應用#136329

2025 年 · #136329

114年 - 114-2 AI 應用規劃師-中級能力鑑定公告試題_第二科：大數據處理分析與應用#136306

2025 年 · #136306

114年 - 114-2 AI 應用規劃師-中級能力鑑定公告試題_一科：人工智慧技術應用與規劃#136301

2025 年 · #136301

114年 - iPAS AI應用規劃師中級能力鑑定-考試樣題(114/09)_科目三：機器學習技術與應用#136300

2025 年 · #136300

114年 - iPAS AI應用規劃師中級能力鑑定-考試樣題(114/09)_科目二：大數據處理分析與應用#136295

2025 年 · #136295

114年 - iPAS AI應用規劃師中級能力鑑定-考試樣題(114/09)_科目一：人工智慧技術應用與規劃#136294

2025 年 · #136294

114年 - iPAS AI 應用規劃師能力鑑定考試樣題(中級)#126106

2025 年 · #126106