你扮演 AI 模型評估專家,面對各種 AI 模型與任務場景,從候選的評估指標中選出最適合的那一個。在 20 題內盡可能拿高分,HP 歸零則 Game Over。
| 難度 | 基礎分 |
|---|---|
| ⬜ 入門 Easy | 100 分 |
| 🟡 進階 Medium | 150 分 |
| 🔴 困難 Hard | 200 分 |
| 💀 BOSS | 300 分 |
| 類別 | 常見指標 |
|---|---|
| 分類指標 | Accuracy, Precision, Recall, F1-Score, AUC-ROC |
| 回歸指標 | MSE, RMSE, MAE, R², MAPE |
| 分群指標 | Silhouette Score, Inertia (SSE) |
| 排序/推薦指標 | MAP, NDCG, MRR |
| 生成/NLP指標 | BLEU, ROUGE, Perplexity, FID, IS |
| 物件偵測指標 | mAP, IoU |
遊戲底層運行 ε-greedy 策略的 RL Agent: