iPAS AI 2026 優先背誦 12 個考點
依 2026 年 3 月試題整理
1. 資料洩漏(Data Leakage)
定義:
測試資料或未來資訊不小心參與訓練流程,導致評估成績看起來很好,但上線後表現變差。
常見考法:
標準化、正規化、特徵選擇、缺失值補值等資料前處理,應該先切分訓練集與測試集,再只用訓練集計算統計量,最後套用到測試集。
易錯點:
不能先對全資料集算平均值、標準差後再切分,這會讓測試集資訊提前被模型看到。
一句話記法:
所有會「學到資料分布」的前處理,都只能 fit 在訓練集。
2. SMOTE
定義:
SMOTE 是處理類別不平衡的過採樣方法,會根據少數類別樣本,在特徵空間中合成新的少數類別樣本。
常見考法:
詐欺偵測、罕見疾病、洗錢偵測等少數類別比例很低時,模型容易偏向預測多數類別。
易錯點:
SMOTE 不是刪除多數類別,也不是調整 loss 權重;它是「合成少數類別樣本」。
一句話記法:
SMOTE = Synthetic Minority Over-sampling,合成少數類。
3. F1 / Recall
定義:
Recall 召回率衡量真正陽性中有多少被找出;F1 是 Precision 與 Recall 的調和平均。
常見考法:
癌症篩檢、詐欺偵測、異常偵測等題目常問要降低漏診或漏抓,通常重 Recall;類別不平衡時常用 F1。
易錯點:
Accuracy 在不平衡資料中很容易誤導。例如 99% 都正常,模型全猜正常也有 99% accuracy,但完全抓不到異常。
一句話記法:
怕漏掉,用 Recall;類別不平衡,看 F1。
4. XAI / LIME / SHAP
定義:
XAI 是可解釋 AI;LIME 與 SHAP 是常見的 post-hoc 解釋方法,用來解釋已訓練模型的預測。
常見考法:
LIME:
用局部近似方式解釋單一預測。
SHAP:
用 Shapley value 分配各特徵對單一預測結果的貢獻。
Saliency Map:
在影像或輸入中標示對預測影響大的區域。
Counterfactual:
問「如果哪些條件改變,結果會不同」。
易錯點:
LIME 不是模型本身透明,而是訓練後再解釋黑盒模型,屬 post-hoc。
一句話記法:
LIME / SHAP 都是黑盒模型訓練後的解釋工具。
5. RAG / Chunking / MCP
定義:
RAG 是檢索增強生成,讓模型先查外部知識再生成回答;Chunking 是把長文件切成小片段以提升檢索品質;MCP 是讓模型連接外部工具或系統的協議。
常見考法:
內部文件、法規、歷史案例、知識庫查詢:
優先想到 RAG。
長文件檢索不準:
用 Chunking。
模型要操作外部工具或系統:
想到 MCP。
易錯點:
RAG 不是重新訓練模型;MCP 不是資料檢索技術。RAG 補知識,MCP 接工具。
一句話記法:
RAG 查資料,Chunking 切文件,MCP 接工具。
6. LoRA / PEFT
定義:
PEFT 是參數高效微調,目標是在不更新全部模型參數的情況下完成微調;LoRA 是常見 PEFT 方法,透過低秩適配降低需更新的參數量。
常見考法:
GPU、記憶體或訓練資源有限,但仍想做 LLM 微調。
易錯點:
LoRA 不是 Prompt Engineering,也不是知識蒸餾。LoRA 是微調方法;知識蒸餾是讓小模型學大模型行為。
一句話記法:
資源有限要微調,選 LoRA / PEFT。
7. Token Economics
定義:
Token Economics 是分析模型推論時 token 使用量與費用,包括輸入 token、輸出 token、API 呼叫次數與推論成本。
常見考法:
估算大量文件生成、客服回覆、報告產出時的 API 費用。
易錯點:
Token Economics 通常看推論階段的 token 成本,不是訓練階段 GPU 記憶體成本。
一句話記法:
Token Economics = 輸入幾個 token、輸出幾個 token、花多少錢。
8. ROI / TCO
定義:
ROI 是投資報酬率,常用來看導入 AI 後節省多少成本、多久回本;TCO 是總體擁有成本,包含直接與間接成本。
常見考法:
ROI:
人工成本 - API 成本 = 每月節省;初期整合成本 / 每月節省 = 回收月數。
TCO:
不只 API 費、人力、基礎設施,也要包含訓練、系統整合、資安、合規、維運。
易錯點:
TCO 不能只看 API 成本;ROI 計算要記得扣掉 AI 使用成本。
一句話記法:
ROI 算回本,TCO 算全部成本。
9. Prompt / RAG 分工
定義:
Prompt Engineering 用來控制模型的語氣、格式、角色與推理方式;RAG 用來補充最新或內部知識。
常見考法:
客服助理要維持品牌語氣,又要每天更新商品或促銷資訊。最佳策略通常是 Prompt 控風格,RAG 補最新資訊。
易錯點:
不要用 Fine-tuning 追每日更新資料,成本高又不穩;也不要期待 RAG 自動學會品牌語氣。
一句話記法:
Prompt 控表達,RAG 補知識。
10. Agent / CoT / Graph Prompting
定義:
Agent 是能依任務狀態、工具、上下文做決策的 AI 系統;CoT 是要求模型逐步推理;Graph Prompting 是用結構化關聯呈現多因素問題。
常見考法:
Context-aware Agent:
利用對話歷史與任務狀態調整行為。
CoT:
逐步說明判斷依據再給結論。
Graph Prompting:
庫存、促銷、物流、區域差異等多條件互相關聯時使用。
易錯點:
CoT 是線性逐步推理;Graph Prompting 更適合多因素關聯,不只是把步驟列出來。
一句話記法:
Agent 會行動,CoT 逐步想,Graph Prompting 畫關係。
11. 同態加密與私有部署
定義:
同態加密允許在加密資料上進行計算;私有部署是把模型放在企業可管理環境中,以降低資料外傳風險。
常見考法:
資料加密狀態下仍需計算:
同態加密。
金融、監理、醫療等高度敏感資料:
偏向私有部署、存取控管、稽核機制。
易錯點:
聯邦學習是資料分散在各端不集中;同態加密是資料加密狀態仍可計算。兩者不要混。
一句話記法:
加密還能算,是同態加密;資料不想外傳,選私有部署。
12. Bias Detection vs Bias Mitigation
定義:
Bias Detection 是檢測偏見是否存在;Bias Mitigation 是採取措施降低偏見。
常見考法:
Detection:
比較不同族群的預測分布、錯誤率、結果差異。
Mitigation:
重新加權樣本、平衡資料分布、調整決策閾值、加入輸出過濾、人工審查與修正。
易錯點:
只是在量測或比較,是檢測;有改資料、改模型、改輸出,就是緩解。
一句話記法:
Detection 是發現問題,Mitigation 是修正問題。
考前總複習口訣
資料先切再標準化,避免 Data Leakage。
少數類別太少,SMOTE 合成少數樣本。
怕漏診看 Recall,不平衡看 F1。
LIME / SHAP 是 post-hoc 解釋。
RAG 查資料,Chunking 切文件,MCP 接工具。
資源有限微調,LoRA / PEFT。
Token Economics 算推論 token 成本。
ROI 算回本,TCO 算全部成本。
Prompt 控語氣格式,RAG 補最新知識。
Agent 會行動,CoT 逐步推理,Graph Prompting 表關聯。
加密仍可計算是同態加密,敏感資料重私有部署。
Bias Detection 是量測,Bias Mitigation 是修正。