iPAS AI 2026 優先背誦 12 個考點

依 2026 年 3 月試題整理

1. 資料洩漏（Data Leakage）

定義：

測試資料或未來資訊不小心參與訓練流程，導致評估成績看起來很好，但上線後表現變差。

常見考法：

標準化、正規化、特徵選擇、缺失值補值等資料前處理，應該先切分訓練集與測試集，再只用訓練集計算統計量，最後套用到測試集。

易錯點：

不能先對全資料集算平均值、標準差後再切分，這會讓測試集資訊提前被模型看到。

一句話記法：

所有會「學到資料分布」的前處理，都只能 fit 在訓練集。

2. SMOTE

定義：

SMOTE 是處理類別不平衡的過採樣方法，會根據少數類別樣本，在特徵空間中合成新的少數類別樣本。

常見考法：

詐欺偵測、罕見疾病、洗錢偵測等少數類別比例很低時，模型容易偏向預測多數類別。

易錯點：

SMOTE 不是刪除多數類別，也不是調整 loss 權重；它是「合成少數類別樣本」。

一句話記法：

SMOTE = Synthetic Minority Over-sampling，合成少數類。

3. F1 / Recall

定義：

Recall 召回率衡量真正陽性中有多少被找出；F1 是 Precision 與 Recall 的調和平均。

常見考法：

癌症篩檢、詐欺偵測、異常偵測等題目常問要降低漏診或漏抓，通常重 Recall；類別不平衡時常用 F1。

易錯點：

Accuracy 在不平衡資料中很容易誤導。例如 99% 都正常，模型全猜正常也有 99% accuracy，但完全抓不到異常。

一句話記法：

怕漏掉，用 Recall；類別不平衡，看 F1。

4. XAI / LIME / SHAP

定義：

XAI 是可解釋 AI；LIME 與 SHAP 是常見的 post-hoc 解釋方法，用來解釋已訓練模型的預測。

常見考法：

LIME：

用局部近似方式解釋單一預測。

SHAP：

用 Shapley value 分配各特徵對單一預測結果的貢獻。

Saliency Map：

在影像或輸入中標示對預測影響大的區域。

Counterfactual：

問「如果哪些條件改變，結果會不同」。

易錯點：

LIME 不是模型本身透明，而是訓練後再解釋黑盒模型，屬 post-hoc。

一句話記法：

LIME / SHAP 都是黑盒模型訓練後的解釋工具。

5. RAG / Chunking / MCP

定義：

RAG 是檢索增強生成，讓模型先查外部知識再生成回答；Chunking 是把長文件切成小片段以提升檢索品質；MCP 是讓模型連接外部工具或系統的協議。

常見考法：

內部文件、法規、歷史案例、知識庫查詢：

優先想到 RAG。

長文件檢索不準：

用 Chunking。

模型要操作外部工具或系統：

想到 MCP。

易錯點：

RAG 不是重新訓練模型；MCP 不是資料檢索技術。RAG 補知識，MCP 接工具。

一句話記法：

RAG 查資料，Chunking 切文件，MCP 接工具。

6. LoRA / PEFT

定義：

PEFT 是參數高效微調，目標是在不更新全部模型參數的情況下完成微調；LoRA 是常見 PEFT 方法，透過低秩適配降低需更新的參數量。

常見考法：

GPU、記憶體或訓練資源有限，但仍想做 LLM 微調。

易錯點：

LoRA 不是 Prompt Engineering，也不是知識蒸餾。LoRA 是微調方法；知識蒸餾是讓小模型學大模型行為。

一句話記法：

資源有限要微調，選 LoRA / PEFT。

7. Token Economics

定義：

Token Economics 是分析模型推論時 token 使用量與費用，包括輸入 token、輸出 token、API 呼叫次數與推論成本。

常見考法：

估算大量文件生成、客服回覆、報告產出時的 API 費用。

易錯點：

Token Economics 通常看推論階段的 token 成本，不是訓練階段 GPU 記憶體成本。

一句話記法：

Token Economics = 輸入幾個 token、輸出幾個 token、花多少錢。

8. ROI / TCO

定義：

ROI 是投資報酬率，常用來看導入 AI 後節省多少成本、多久回本；TCO 是總體擁有成本，包含直接與間接成本。

常見考法：

ROI：

人工成本 - API 成本 = 每月節省；初期整合成本 / 每月節省 = 回收月數。

TCO：

不只 API 費、人力、基礎設施，也要包含訓練、系統整合、資安、合規、維運。

易錯點：

TCO 不能只看 API 成本；ROI 計算要記得扣掉 AI 使用成本。

一句話記法：

ROI 算回本，TCO 算全部成本。

9. Prompt / RAG 分工

定義：

Prompt Engineering 用來控制模型的語氣、格式、角色與推理方式；RAG 用來補充最新或內部知識。

常見考法：

客服助理要維持品牌語氣，又要每天更新商品或促銷資訊。最佳策略通常是 Prompt 控風格，RAG 補最新資訊。

易錯點：

不要用 Fine-tuning 追每日更新資料，成本高又不穩；也不要期待 RAG 自動學會品牌語氣。

一句話記法：

Prompt 控表達，RAG 補知識。

10. Agent / CoT / Graph Prompting

定義：

Agent 是能依任務狀態、工具、上下文做決策的 AI 系統；CoT 是要求模型逐步推理；Graph Prompting 是用結構化關聯呈現多因素問題。

常見考法：

Context-aware Agent：

利用對話歷史與任務狀態調整行為。

CoT：

逐步說明判斷依據再給結論。

Graph Prompting：

庫存、促銷、物流、區域差異等多條件互相關聯時使用。

易錯點：

CoT 是線性逐步推理；Graph Prompting 更適合多因素關聯，不只是把步驟列出來。

一句話記法：

Agent 會行動，CoT 逐步想，Graph Prompting 畫關係。

11. 同態加密與私有部署

定義：

同態加密允許在加密資料上進行計算；私有部署是把模型放在企業可管理環境中，以降低資料外傳風險。

常見考法：

資料加密狀態下仍需計算：

同態加密。

金融、監理、醫療等高度敏感資料：

偏向私有部署、存取控管、稽核機制。

易錯點：

聯邦學習是資料分散在各端不集中；同態加密是資料加密狀態仍可計算。兩者不要混。

一句話記法：

加密還能算，是同態加密；資料不想外傳，選私有部署。

12. Bias Detection vs Bias Mitigation

定義：

Bias Detection 是檢測偏見是否存在；Bias Mitigation 是採取措施降低偏見。

常見考法：

Detection：

比較不同族群的預測分布、錯誤率、結果差異。

Mitigation：

重新加權樣本、平衡資料分布、調整決策閾值、加入輸出過濾、人工審查與修正。

易錯點：

只是在量測或比較，是檢測；有改資料、改模型、改輸出，就是緩解。

一句話記法：

Detection 是發現問題，Mitigation 是修正問題。

考前總複習口訣

資料先切再標準化，避免 Data Leakage。

少數類別太少，SMOTE 合成少數樣本。

怕漏診看 Recall，不平衡看 F1。

LIME / SHAP 是 post-hoc 解釋。

RAG 查資料，Chunking 切文件，MCP 接工具。

資源有限微調，LoRA / PEFT。

Token Economics 算推論 token 成本。

ROI 算回本，TCO 算全部成本。

Prompt 控語氣格式，RAG 補最新知識。

Agent 會行動，CoT 逐步推理，Graph Prompting 表關聯。

加密仍可計算是同態加密，敏感資料重私有部署。

Bias Detection 是量測，Bias Mitigation 是修正。