14. 某工程師計劃將通用 LLM 在醫療問答語料上進行監督微調(Supervised FineTuning, SFT)，但發生了災難性遺忘(Catastrophic Forgetting)問題。在計算資源有限的情況下，工程師希望透過調整微調策略來緩解此問題。下列哪一種訓練設計最能有效率地學習新任務的同時保留原有能力？
(A)凍結大部分預訓練參數，僅對少量新增模組(如 LoRA 層)進行微調，並控制更新範圍以減少對原有知識的干擾；
(B)提高學習率(Learning Rate)並縮短訓練步數，使模型快速收斂至新任務，避免長時間訓練造成遺忘；
(C)僅使用醫療語料進行多輪訓練，強化模型對新任務的專注程度；
(D)增加批次大小(Batch Size)以穩定梯度更新，使模型同時保留舊知識與學習新知識

答案：登入後查看
統計： A(9), B(3), C(0), D(3), E(0) #3934325

相關試題

15. 某企業建置一套多代理人(Multi-Agent)系統，由一個 Orchestrator Agent 負責任務分配，多個 Worker Agent 分別執行網路搜尋、程式撰寫與結果彙整。若 Orchestrator 發現某 Worker Agent 回傳結果品質不符合預期，從系統容錯與任務可靠性角度，下列哪一項機制最能確保整體任務仍能正確完成？ (A)直接採用該 Worker Agent 的輸出，避免重試機制造成延遲； (B)Orchestrator 具備結果評估能力，對不合格結果觸發重試(Retry)或重新分配給不同 Worker，並記錄失敗原因供後續改善； (C)強制所有 Worker Agent 統一使用相同的 LLM 模型，以減少輸出差異； (D)當任何一個 Worker 失敗時，整個 Multi-Agent 任務直接中止並通知使用者重新啟動

16. 一位工程師正在實作一個 ReAct 框架的 AI Agent，該 Agent 需要回答「台灣目前最大的電動車充電站營運商是哪間公司，以及其充電樁總數」。 Agent 的工具清單如下： •web_search(query)：回傳搜尋結果摘要 •get_webpage(url)：回傳網頁內文 •calculator(expression)：回傳計算結果•get_current_date()：回傳今日日期工程師設計了以下的 System Prompt 與 ReAct Loop，請問此 Agent 設計存在哪些問題？應如何改善？[System Prompt] 你是一個資料查詢助理。每次只能使用一個工具。當你知道答案時，直接輸出最終答案。[第一輪 Agent 輸出] Thought: 我已經知道台灣電動車市場的概況，不需要搜尋，可以直接回答。Action: 無 Answer: 台灣最大充電站營運商是 XX 公司，共有 500 個充電樁。 (A)System Prompt 未要求 Agent 在回答前使用工具驗證，導致直接依賴既有知識產生幻覺(Hallucination)；應明確規定即時性問題需先執行 web_search； (B)工具清單提供了 calculator 與 get_current_date，屬於多餘工具，可能增加 Agent 的選擇複雜度； (C)ReAct 框架的核心問題在於 Thought 步驟佔用過多 token，應移除 Thought 欄位，直接讓 Agent 輸出 Action，以提升推理效率； (D)Agent 應在第一輪就呼叫所有可用工具並彙整結果，避免多輪 Loop 造成的延遲

17. 某醫療新創公司正在開發一套「多模態患者風險評估系統」，需同時處理三種異質資料來源：胸腔 X 光影像(影像模態)、臨床診斷筆記(文字模態)，以及心率與血氧的時序感測資料(數值時序模態)。工程師在進行各模態的特徵擷取模型選擇時，需為每種模態挑選最適合的模型架構。下列哪一組模型配置最符合三種模態各自的資料特性？ (A)影像模態用 LSTM、文字模態用 CNN、時序模態用 BERT； (B)影像模態用 TF-IDF、文字模態用 ResNet、時序模態用 Word2Vec； (C)三種模態統一使用 BERT，因為 Transformer 架構具備通用性，可處理任意形式的輸入資料； (D)影像模態用 CNN、文字模態用 Transformer、時序模態用 LSTM 或 Temporal CNN

18. 某醫院的 AI 研究團隊正在開發一套整合「CT 影像+電子病歷文本+基因序列」三種模態資料的癌症預測模型。請問在此場景中採用「跨模態對齊(Cross-Modal Alignment)」技術主要解決什麼問題？ (A)使模型僅聚焦於 CT 影像資料，避免文本與基因資料引入雜訊； (B)自動生成跨模態配對標註，以減少人工標記需求； (C)降低多模態資料的儲存與計算成本，以提升訓練效率； (D)將不同模態的資料表示對齊至共同語意空間，使模型能建立跨模態之間的語意關聯

19. 一家電商公司已將推薦系統 AI 模型上線三個月，業務主管要求專案團隊評估導入成效。團隊根據下圖數據得出結論：「因為 AUC 高達 0.91，模型表現優異，AI 導入成效良好。」請問此評估結論存在什麼根本問題？ (A)僅依賴離線指標 AUC 判斷模型成效，忽略線上業務指標(如 CTR 與營收) 的變化，可能導致錯誤結論； (B)AUC 已達 0.91，代表模型排序能力優異，即使 CTR 略為下降，仍可視為推薦品質提升； (C)CTR 從 3.2%降至 3.1%，顯示模型效果變差，應立即還原(Rollback)至舊模型； (D)平均訂單金額提升至$1,020，代表模型已成功優化營收，因此無需考慮其他指標

20. 某電商公司計畫導入即時推薦系統，希望使用者進入網站後能在 100 毫秒內取得推薦結果，且推薦結果需依據最新使用者行為進行調整。系統需支援每日約 50 萬活躍使用者，尖峰時段每秒約 3,000 筆請求(QPS)。目前公司已累積歷史購買紀錄與瀏覽行為資料，並持續接收即時點擊流(Streaming Data)。IT 基礎架構採用雲端環境，團隊配置為 2 名資料工程師與 1 名機器學習工程師。某工程師提出以下導入規劃：(1)使用批次訓練(Batch Training)建立協同過濾模型(2)將模型部署為 REST API 提供即時推論服務(3)使用 Kafka 串流處理即時使用者行為特徵 (4)將所有即時資料先寫入資料倉儲(Data Warehouse)再進行特徵計算(5)使用 Redis 或 Feature Store 快取即時特徵請問以下哪一項最合理的技術導入規劃組合與調整建議？ (A)保留(1)(2)(3)，移除(4)，並加入(5)以降低延遲； (B)保留(1)(4)，移除(3)，以確保資料一致性與系統穩定； (C)保留(2)(4)(5)，移除(1)，改用即時線上學習(Online Learning)； (D)全部保留(1)~(5)，可同時兼顧即時性與資料完整性

21. 一位機器學習工程師正在優化公司內部的 RAG 法律文件問答系統。近期因營運成本壓力，公司要求在不更換模型且不影響回答品質的前提下，將整體 token 成本降低至目前的 60%，且目前成本主要集中於輸入 tokens。工程師在檢查系統後，盤點出目前的使用情況如下： ◆使用模型：GPT-4o(輸入$5／1M tokens、輸出 $15／1M tokens) ◆每次查詢：將前 10 筆檢索文件區塊全部加入 Prompt(每塊約 600 tokens) ◆System Prompt：每次請求均包含約 500tokens 的公司背景說明 ◆對話機制：保留完整對話歷史，平均累積約 8,000tokens◆每日查詢量：約 5,000 次 ◆平均輸出：約 300tokens／次在上述限制與系統現況下，請問下列哪一項優化組合，最能在維持回答品質的前提下有效降低 token 成本？ (A)將輸出 max_tokens 從 1,000 壓縮至 200，強制模型給出更短的回答，以降低輸出費用； (B)將 System Prompt 改為 Prompt Caching 或靜態前綴重用，並對對話歷史實作摘要壓縮，以保留語意而非完整對話； (C)將所有查詢改為 Batch API 模式送出，透過非同步處理降低單次費用； (D)在 Prompt 中明確要求模型「回答時盡量簡短」，透過指令引導模型自行縮減輸出長度

22. 某金融科技公司計劃建立完整的 AI 開發到維運流程，希望實現「模型訓練→測試→部署→監控→再訓練」的自動化流程串接，並確保線上模型的版本可追溯。技術主管建議引入 MLOps 框架。MLOps 在此 AI 開發生命週期中的核心角色為何？(A)專注於訓練資料的標註與品質控管，以提升模型訓練效果； (B)透過自動化模型搜尋與參數調整，降低模型開發門檻； (C)建立機器學習流程的自動化與版本管理機制，支援模型部署、監控與持續更新； (D)確保模型在部署後維持穩定效能，減少後續維運與更新需求

23. 某製造業公司計劃將 AI 導入生產線瑕疵檢測流程，目前瑕疵樣本約 800 張(含各類瑕疵類型)、正常樣本約 15,000 張，現有 IT 基礎設施為地端伺服器且無 GPU，且生產線環境需於地端即時完成推論，檢測需求為每片零件須在 100 毫秒內完成檢測，且預算為中等、無法於短期內大規模採購硬體。工程師正在規劃第一階段的 AI 導入方案，請問下列哪一種規劃最為合適？ (A)從零訓練一個大型 CNN 模型，並採購高階 GPU 伺服器以滿足推論速度需求； (B)採用預訓練模型進行 Transfer Learning，針對瑕疵樣本進行 Fine-tuning，並使用模型量化(Quantization)或蒸餾(Distillation)技術壓縮模型以符合延遲需求，部署於地端； (C)因樣本數不足，建議先暫緩 AI 導入，待蒐集至少 10 萬筆瑕疵樣本後再啟動專案； (D)將所有影像上傳至雲端，使用第三方 AutoML 平台自動訓練並部署，以節省開發時間

24. 某即時詐欺偵測系統對模型回應時間有嚴格限制，若推論延遲過高將影響交易核准流程。維運工程師在模型上線前進行延遲測試(Latency Testing)時，主要評估的目標為何？ (A)評估模型推論過程中的記憶體使用量，以確認部署資源是否足夠； (B)驗證模型對異常或攻擊輸入的穩定性與安全性； (C)評估模型在不同使用者族群上的預測結果是否一致； (D)評估模型從接收輸入到產生預測結果所需的回應時間是否符合系統要求

相關試卷

115年 - 115-1 AI應用規劃師_中級能力鑑定公告試題_第三科：機器學習技術與應用#141075

2026 年 · #141075

115年 - 115-1 中級AI應用規劃師試題_第二科：大數據處理分析與應用#141063

2026 年 · #141063

115年 - 115-1中級AI應用規劃師公告試題_第一科：人工智慧技術應用與規劃_#141062

2026 年 · #141062

114年 - 114-2 AI 應用規劃師-中級能力鑑定公告試題_第三科：機器學習技術與應用#136329

2025 年 · #136329

114年 - 114-2 AI 應用規劃師-中級能力鑑定公告試題_第二科：大數據處理分析與應用#136306

2025 年 · #136306

114年 - 114-2 AI 應用規劃師-中級能力鑑定公告試題_一科：人工智慧技術應用與規劃#136301

2025 年 · #136301

114年 - iPAS AI應用規劃師中級能力鑑定-考試樣題(114/09)_科目三：機器學習技術與應用#136300

2025 年 · #136300

114年 - iPAS AI應用規劃師中級能力鑑定-考試樣題(114/09)_科目二：大數據處理分析與應用#136295

2025 年 · #136295

114年 - iPAS AI應用規劃師中級能力鑑定-考試樣題(114/09)_科目一：人工智慧技術應用與規劃#136294

2025 年 · #136294

114年 - iPAS AI 應用規劃師能力鑑定考試樣題(中級)#126106

2025 年 · #126106