考前 10 分鐘試題知識點回顧

考前 10 分鐘試題知識點回顧

考前 10 分鐘試題知識點回顧

iPAS AI 規劃師：考前 10 分鐘黃金觀念 50 條

一、技術原理與統計 (01-09)

結構化資料看 Excel 表格；非結構化看影音圖文。
標籤 (Label) 是監督式學習的靈魂。
特徵工程佔專案 80% 時間。
歸一化 (Normalization) 讓不同單位的特徵（如身高與體重）有相同權重。
相關性 ≠ 因果關係，這是統計題必考陷阱。
線性迴歸預測連續數字；邏輯迴歸預測分類結果（是/否）。
K-Means 是分群（無標籤），K-NN 是分類（有標籤）。
PCA (主成分分析) 核心是「降維」並保留最大變異量。
平均數易受離群值影響，中位數較穩定。
決策樹可解釋性強，但易產生過擬合 (Overfitting)。

二、機器學習與診斷 (10-14)

訓練集練兵，測試集驗收，驗證集調參數。
過擬合：訓練好、測試爛。解決：增加數據、正則化 (L1/L2)。
欠擬合：訓練爛、測試爛。解決：增加特徵、換更複雜的模型。
數據不平衡（如盜刷、癌症）：看 Recall (召回率)。
精確率 (Precision)：強調「抓得準」；召回率 (Recall)：強調「不漏抓」。
F1-Score 是精確與召回的調和平均數。
混淆矩陣中，FP (偽陽性) 是「狼來了」；FN (偽陰性) 是「漏掉狼」。
交叉驗證 (K-fold) 是為了確保模型在不同數據切片下都穩定。
梯度下降 (Gradient Descent) 是為了尋找損失函數的最小值。
學習率 (Learning Rate) 太大會跳過最優點，太小會跑太慢。

三、深度學習與生成式 AI (15-20)

CNN 核心是卷積層 (Convolution)，專打影像題。
RNN/LSTM 專打時間序列與有順序的文字。
Transformer 的靈魂是 Self-Attention (自注意力機制)。
生成式 AI (GAI) 具有隨機性，不保證每次結果相同。
Temperature (溫度) 低 = 保守；高 = 創意。
Token 是 AI 閱讀的單位，不是字數。
幻覺 (Hallucination)：AI 信心滿滿地編造事實。
RAG (檢索增強)：外掛資料庫，解決即時性與幻覺問題。
Fine-tuning (微調)：改變模型性格、口吻或學會專業格式。
提示工程 (Prompt Engineering)：透過指令優化輸出的技術。

四、專案管理與維運 (21-23)

CRISP-DM 第一步永遠是「商業理解」。
POC (概念驗證) 是驗證「做不做得到」。
資料漂移 (Data Drift)：輸入特徵分布變了（如疫情）。
概念漂移 (Concept Drift)：X 與 Y 的關係變了（如定義變更）。
MLOps 核心是持續訓練 (CT)。
A/B 測試：流量分兩半，實測誰有效。
金絲雀部署：先給 5% 用戶用，沒事再擴大。
影子部署：新模型只紀錄不輸出，用於上線前對比。
SaaS 導入最快；RAG 更新最靈活；Fine-tuning 客製最深。
邊緣運算 (Edge AI)：低延遲、高隱私、頻寬省。

五、倫理、法規與場景 (24-29)

可解釋性 (XAI)：解決 AI 黑盒子問題，金融醫療必考。
演算法偏見：源自訓練數據不公平。
去識別化：GDPR 隱私保護的核心手段。
聯邦學習：數據不動，模型動。保護資料隱私。
Deepfake：涉及倫理與肖像權風險。
智慧製造：找 CNN (影像檢測) 或 LSTM (預測維護)。
智慧金融：找 XGBoost (信用評分) 或 XAI。
智慧醫療：找 U-Net (影像分割) 或聯邦學習。
智慧零售：找推薦系統 (協同過濾)。
規劃師價值：是橋樑，不是寫程式的人。

📝 考前最後叮嚀

答題技巧：題目長時，先看結尾問什麼指標（Accuracy、Recall 還是 Precision）。
陷阱排除：看到「絕對正確」、「保證」、「AI 可以取代人類情感」等詞彙，通常是錯誤選項。
分數分配：學科二的情境題分數較重，務必預留時間思考邏輯。