29. 某 AI 研究團隊採用 GRPO(Group Relative Policy Optimization)作為一種基於強化學習的模型優化方法，用於提升大型語言模型的表現。請問 GRPO 最適合用來強化模型在哪一類任務上的表現？
(A)判斷客服留言的情緒傾向，將每則訊息快速歸類為正面、負面或中性；
(B)將客服電話錄音即時轉換為文字，供後續人工審閱使用；
(C)針對數學應用題或邏輯謎題，逐步推導出正確解答；
(D)分析商品圖片的外觀特徵，自動辨識類別與品項

答案：登入後查看
統計： A(25), B(4), C(21), D(8), E(0) #3922923

。

B1 · 2026/06/11

#7403215

第 29 題正確答案： C 解析： ...

(共 198 字，隱藏中）

前往觀看

kelly

2026/06/23

私人筆記#8289367

未解鎖

正確答案是 (C)。GRPO 最適合強化...

(共 744 字，隱藏中）

前往觀看

Chia-Pei Lee

2026/07/10

私人筆記#8407505

未解鎖

正確答案是 (C)。核心解析這題考...

(共 630 字，隱藏中）

前往觀看