快樂學習 iPAS 一次就過!

iPAS AI 2026 優先背誦 12 個考點

iPAS AI 2026 優先背誦 12 個考點

依 2026 年 3 月試題整理


1. 資料洩漏(Data Leakage)

定義:

測試資料或未來資訊不小心參與訓練流程,導致評估成績看起來很好,但上線後表現變差。

常見考法:

標準化、正規化、特徵選擇、缺失值補值等資料前處理,應該先切分訓練集與測試集,再只用訓練集計算統計量,最後套用到測試集。

易錯點:

不能先對全資料集算平均值、標準差後再切分,這會讓測試集資訊提前被模型看到。

一句話記法:

所有會「學到資料分布」的前處理,都只能 fit 在訓練集。


2. SMOTE

定義:

SMOTE 是處理類別不平衡的過採樣方法,會根據少數類別樣本,在特徵空間中合成新的少數類別樣本。

常見考法:

詐欺偵測、罕見疾病、洗錢偵測等少數類別比例很低時,模型容易偏向預測多數類別。

易錯點:

SMOTE 不是刪除多數類別,也不是調整 loss 權重;它是「合成少數類別樣本」。

一句話記法:

SMOTE = Synthetic Minority Over-sampling,合成少數類。


3. F1 / Recall

定義:

Recall 召回率衡量真正陽性中有多少被找出;F1 是 Precision 與 Recall 的調和平均。

常見考法:

癌症篩檢、詐欺偵測、異常偵測等題目常問要降低漏診或漏抓,通常重 Recall;類別不平衡時常用 F1。

易錯點:

Accuracy 在不平衡資料中很容易誤導。例如 99% 都正常,模型全猜正常也有 99% accuracy,但完全抓不到異常。

一句話記法:

怕漏掉,用 Recall;類別不平衡,看 F1。


4. XAI / LIME / SHAP

定義:

XAI 是可解釋 AI;LIME 與 SHAP 是常見的 post-hoc 解釋方法,用來解釋已訓練模型的預測。

常見考法:

LIME:

用局部近似方式解釋單一預測。

SHAP:

用 Shapley value 分配各特徵對單一預測結果的貢獻。

Saliency Map:

在影像或輸入中標示對預測影響大的區域。

Counterfactual:

問「如果哪些條件改變,結果會不同」。

易錯點:

LIME 不是模型本身透明,而是訓練後再解釋黑盒模型,屬 post-hoc。

一句話記法:

LIME / SHAP 都是黑盒模型訓練後的解釋工具。


5. RAG / Chunking / MCP

定義:

RAG 是檢索增強生成,讓模型先查外部知識再生成回答;Chunking 是把長文件切成小片段以提升檢索品質;MCP 是讓模型連接外部工具或系統的協議。

常見考法:

內部文件、法規、歷史案例、知識庫查詢:

優先想到 RAG。

長文件檢索不準:

用 Chunking。

模型要操作外部工具或系統:

想到 MCP。

易錯點:

RAG 不是重新訓練模型;MCP 不是資料檢索技術。RAG 補知識,MCP 接工具。

一句話記法:

RAG 查資料,Chunking 切文件,MCP 接工具。


6. LoRA / PEFT

定義:

PEFT 是參數高效微調,目標是在不更新全部模型參數的情況下完成微調;LoRA 是常見 PEFT 方法,透過低秩適配降低需更新的參數量。

常見考法:

GPU、記憶體或訓練資源有限,但仍想做 LLM 微調。

易錯點:

LoRA 不是 Prompt Engineering,也不是知識蒸餾。LoRA 是微調方法;知識蒸餾是讓小模型學大模型行為。

一句話記法:

資源有限要微調,選 LoRA / PEFT。


7. Token Economics

定義:

Token Economics 是分析模型推論時 token 使用量與費用,包括輸入 token、輸出 token、API 呼叫次數與推論成本。

常見考法:

估算大量文件生成、客服回覆、報告產出時的 API 費用。

易錯點:

Token Economics 通常看推論階段的 token 成本,不是訓練階段 GPU 記憶體成本。

一句話記法:

Token Economics = 輸入幾個 token、輸出幾個 token、花多少錢。


8. ROI / TCO

定義:

ROI 是投資報酬率,常用來看導入 AI 後節省多少成本、多久回本;TCO 是總體擁有成本,包含直接與間接成本。

常見考法:

ROI:

人工成本 - API 成本 = 每月節省;初期整合成本 / 每月節省 = 回收月數。

TCO:

不只 API 費、人力、基礎設施,也要包含訓練、系統整合、資安、合規、維運。

易錯點:

TCO 不能只看 API 成本;ROI 計算要記得扣掉 AI 使用成本。

一句話記法:

ROI 算回本,TCO 算全部成本。


9. Prompt / RAG 分工

定義:

Prompt Engineering 用來控制模型的語氣、格式、角色與推理方式;RAG 用來補充最新或內部知識。

常見考法:

客服助理要維持品牌語氣,又要每天更新商品或促銷資訊。最佳策略通常是 Prompt 控風格,RAG 補最新資訊。

易錯點:

不要用 Fine-tuning 追每日更新資料,成本高又不穩;也不要期待 RAG 自動學會品牌語氣。

一句話記法:

Prompt 控表達,RAG 補知識。


10. Agent / CoT / Graph Prompting

定義:

Agent 是能依任務狀態、工具、上下文做決策的 AI 系統;CoT 是要求模型逐步推理;Graph Prompting 是用結構化關聯呈現多因素問題。

常見考法:

Context-aware Agent:

利用對話歷史與任務狀態調整行為。

CoT:

逐步說明判斷依據再給結論。

Graph Prompting:

庫存、促銷、物流、區域差異等多條件互相關聯時使用。

易錯點:

CoT 是線性逐步推理;Graph Prompting 更適合多因素關聯,不只是把步驟列出來。

一句話記法:

Agent 會行動,CoT 逐步想,Graph Prompting 畫關係。


11. 同態加密與私有部署

定義:

同態加密允許在加密資料上進行計算;私有部署是把模型放在企業可管理環境中,以降低資料外傳風險。

常見考法:

資料加密狀態下仍需計算:

同態加密。

金融、監理、醫療等高度敏感資料:

偏向私有部署、存取控管、稽核機制。

易錯點:

聯邦學習是資料分散在各端不集中;同態加密是資料加密狀態仍可計算。兩者不要混。

一句話記法:

加密還能算,是同態加密;資料不想外傳,選私有部署。


12. Bias Detection vs Bias Mitigation

定義:

Bias Detection 是檢測偏見是否存在;Bias Mitigation 是採取措施降低偏見。

常見考法:

Detection:

比較不同族群的預測分布、錯誤率、結果差異。

Mitigation:

重新加權樣本、平衡資料分布、調整決策閾值、加入輸出過濾、人工審查與修正。

易錯點:

只是在量測或比較,是檢測;有改資料、改模型、改輸出,就是緩解。

一句話記法:

Detection 是發現問題,Mitigation 是修正問題。


考前總複習口訣

資料先切再標準化,避免 Data Leakage。

少數類別太少,SMOTE 合成少數樣本。

怕漏診看 Recall,不平衡看 F1。

LIME / SHAP 是 post-hoc 解釋。

RAG 查資料,Chunking 切文件,MCP 接工具。

資源有限微調,LoRA / PEFT。

Token Economics 算推論 token 成本。

ROI 算回本,TCO 算全部成本。

Prompt 控語氣格式,RAG 補最新知識。

Agent 會行動,CoT 逐步推理,Graph Prompting 表關聯。

加密仍可計算是同態加密,敏感資料重私有部署。

Bias Detection 是量測,Bias Mitigation 是修正。