AI 評估指標大師 — 模型 × 指標配對挑戰

📖 遊戲說明

🎯 遊戲目標

你扮演 AI 模型評估專家，面對各種 AI 模型與任務場景，從候選的評估指標中選出最適合的那一個。在 20 題內盡可能拿高分，HP 歸零則 Game Over。

⚙️ 基本規則

每題限時 60 秒，超時視為答錯
答錯或超時扣 15 HP，起始 HP 為 100
HP 歸零 → Game Over，不會再繼續出題
共 20 題，每題從 5 個指標中選 1 個正解

⭐ 計分方式

難度	基礎分
⬜ 入門 Easy	100 分
🟡 進階 Medium	150 分
🔴 困難 Hard	200 分
💀 BOSS	300 分

速度加分：剩餘秒數 × 5 分
🔥 Combo 加分：連對 3 題以上，連擊數 × 20 分

📊 評估指標分類

類別	常見指標
分類指標	Accuracy, Precision, Recall, F1-Score, AUC-ROC
回歸指標	MSE, RMSE, MAE, R², MAPE
分群指標	Silhouette Score, Inertia (SSE)
排序/推薦指標	MAP, NDCG, MRR
生成/NLP指標	BLEU, ROUGE, Perplexity, FID, IS
物件偵測指標	mAP, IoU

🤖 強化學習引擎

遊戲底層運行 ε-greedy 策略的 RL Agent：

探索 (Explore)：隨機抽題，讓你接觸不同領域
利用 (Exploit)：根據你的弱項分類，針對性出題
隨著遊戲進行，ε 逐漸衰減 → 越到後面越針對你的弱點

⏳ The World ザ・ワールド砸瓦魯多！

整場遊戲共 3 次使用機會
每次啟動可暫停計時器 60 秒，讓你冷靜思考
暫停期間仍可選擇答案，選完自動恢復

💡 小提示

關鍵詞對應：「不平衡資料」→ F1/AUC、「連續預測」→ MSE/RMSE、「排序」→ NDCG/MAP
「少數類別重要」→ Recall、「誤報成本高」→ Precision
指標卡片上的 Tags 是重要線索！

📝 iPAS 考點提醒

「替任務挑對評估指標」是 iPAS 高頻應用題(初級科目一、中級科目三)。重點:分類看 Accuracy/Precision/Recall/F1/AUC-ROC、迴歸看 MAE/MSE/RMSE/R²、物件偵測用 mAP 與 IoU、影像生成用 FID、機器翻譯用 BLEU、語言模型用 Perplexity。易混點:類別不平衡別只看準確率(改用 F1 或 AUC);不同任務用不同指標,別張冠李戴;FID、Perplexity 是越低越好。情境:看模型與任務,選最合適的指標。

想練情境題與詳解 → AI 學習與考證地圖

❓ 常見問題

分類任務常用哪些指標？

Accuracy、Precision、Recall、F1、AUC-ROC;類別不平衡時偏重 F1 或 AUC,並看混淆矩陣。

迴歸任務用什麼指標？

MAE、MSE、RMSE(誤差大小)與 R²(解釋變異比例);RMSE 對大誤差較敏感。

生成式、NLP、電腦視覺各用什麼？

影像生成用 FID(越低越好);機器翻譯用 BLEU;語言模型用 Perplexity(越低越好);物件偵測用 mAP;影像分割用 IoU、Dice。

為什麼不平衡資料不能只看準確率？

若多數類佔比極高,全猜多數類就有很高準確率卻毫無用處;應改用 F1、AUC-ROC 或直接看混淆矩陣。

怎麼替任務選指標？

先判斷任務型態(分類/迴歸/生成/偵測),再看在意誤報還是漏報、資料是否平衡,挑對應指標;必要時多指標並看。

← 返回 AI 學習與考證地圖