考前 10 分鐘試題知識點回顧
iPAS AI 規劃師:考前 10 分鐘黃金觀念 50 條
一、 技術原理與統計 (01-09)
- 結構化資料看 Excel 表格;非結構化看影音圖文。
- 標籤 (Label) 是監督式學習的靈魂。
- 特徵工程佔專案 80% 時間。
- 歸一化
(Normalization) 讓不同單位的特徵(如身高與體重)有相同權重。
- 相關性 ≠ 因果關係,這是統計題必考陷阱。
- 線性迴歸預測連續數字;邏輯迴歸預測分類結果(是/否)。
- K-Means 是分群(無標籤),K-NN 是分類(有標籤)。
- PCA (主成分分析) 核心是「降維」並保留最大變異量。
- 平均數易受離群值影響,中位數較穩定。
- 決策樹可解釋性強,但易產生過擬合
(Overfitting)。
二、 機器學習與診斷 (10-14)
- 訓練集練兵,測試集驗收,驗證集調參數。
- 過擬合:訓練好、測試爛。解決:增加數據、正則化 (L1/L2)。
- 欠擬合:訓練爛、測試爛。解決:增加特徵、換更複雜的模型。
- 數據不平衡(如盜刷、癌症):看 Recall (召回率)。
- 精確率
(Precision):強調「抓得準」;召回率 (Recall):強調「不漏抓」。
- F1-Score 是精確與召回的調和平均數。
- 混淆矩陣中,FP (偽陽性) 是「狼來了」;FN (偽陰性) 是「漏掉狼」。
- 交叉驗證 (K-fold) 是為了確保模型在不同數據切片下都穩定。
- 梯度下降 (Gradient
Descent) 是為了尋找損失函數的最小值。
- 學習率 (Learning
Rate) 太大會跳過最優點,太小會跑太慢。
三、 深度學習與生成式 AI (15-20)
- CNN 核心是卷積層
(Convolution),專打影像題。
- RNN/LSTM 專打時間序列與有順序的文字。
- Transformer 的靈魂是
Self-Attention (自注意力機制)。
- 生成式 AI (GAI) 具有隨機性,不保證每次結果相同。
- Temperature (溫度) 低 = 保守;高 = 創意。
- Token 是 AI 閱讀的單位,不是字數。
- 幻覺
(Hallucination):AI 信心滿滿地編造事實。
- RAG (檢索增強):外掛資料庫,解決即時性與幻覺問題。
- Fine-tuning (微調):改變模型性格、口吻或學會專業格式。
- 提示工程 (Prompt
Engineering):透過指令優化輸出的技術。
四、 專案管理與維運 (21-23)
- CRISP-DM 第一步永遠是「商業理解」。
- POC (概念驗證) 是驗證「做不做得到」。
- 資料漂移 (Data
Drift):輸入特徵分布變了(如疫情)。
- 概念漂移 (Concept
Drift):X 與 Y 的關係變了(如定義變更)。
- MLOps 核心是持續訓練 (CT)。
- A/B 測試:流量分兩半,實測誰有效。
- 金絲雀部署:先給 5% 用戶用,沒事再擴大。
- 影子部署:新模型只紀錄不輸出,用於上線前對比。
- SaaS 導入最快;RAG 更新最靈活;Fine-tuning 客製最深。
- 邊緣運算 (Edge AI):低延遲、高隱私、頻寬省。
五、 倫理、法規與場景 (24-29)
- 可解釋性 (XAI):解決 AI 黑盒子問題,金融醫療必考。
- 演算法偏見:源自訓練數據不公平。
- 去識別化:GDPR 隱私保護的核心手段。
- 聯邦學習:數據不動,模型動。保護資料隱私。
- Deepfake:涉及倫理與肖像權風險。
- 智慧製造:找 CNN (影像檢測) 或 LSTM (預測維護)。
- 智慧金融:找 XGBoost (信用評分) 或 XAI。
- 智慧醫療:找 U-Net (影像分割) 或聯邦學習。
- 智慧零售:找推薦系統 (協同過濾)。
- 規劃師價值:是橋樑,不是寫程式的人。
📝 考前最後叮嚀
- 答題技巧:題目長時,先看結尾問什麼指標(Accuracy、Recall 還是 Precision)。
- 陷阱排除:看到「絕對正確」、「保證」、「AI 可以取代人類情感」等詞彙,通常是錯誤選項。
- 分數分配:學科二的情境題分數較重,務必預留時間思考邏輯。