49. 若團隊需要建立一個超過 50 層的深層神經網路,以捕捉晶圓表面細微的劃傷特徵, 但又擔心傳統深層網路常見的梯度消失(Vanishing Gradient)問題,則下列哪一種 經典架構最適合優先考慮?
(A)VGG(Visual Geometry Group):透過重複堆疊 3×3 卷積層與池化層來維持梯度 穩定;
(B)GoogLeNet:透過 Inception 模塊並行使用不同大小的卷積核,以避免深層網路 的梯度問題;
(C)ResNet ( Residual Network ): 透 過 殘 差 連 接 ( Residual Connection / Skip Connection),使梯度能跨層傳遞並降低深層訓練困難;
(D)Vision Transformer(ViT):完全捨棄卷積,因此不會出現任何深層模型的訓練 問題

答案:登入後查看
統計: 尚無統計資料