🎮 怎麼玩
當你輸入 Prompt(例如「蘋果發表了一個新產品MACBOOK NEO」),AI 模型(如 ChatGPT、Claude)並不是直接「看懂」文字然後回答,而是經過 7
個嚴謹的數學運算步驟才產生輸出。
左側有這 7 個步驟的卡片,順序已打亂。你的任務是把它們拖拉到右側對應的格子,放對就會展開該步驟的詳細計算說明。放錯會全部重置,從頭再來!
🧠 什麼是 Transformer?
Transformer 是 2017 年 Google 提出的神經網路架構,是 ChatGPT、Claude、Gemini 等大型語言模型(LLM)的核心引擎。
它的關鍵創新是「自注意力機制(Self-Attention)」——讓模型在處理每個字時,同時考慮整句話所有字的關係,而不是一個字一個字依序處理,所以能理解複雜的上下文。
⚖️ 這個遊戲的獎懲機制 ── 模仿 AI 訓練中的強化學習(RLHF)
真實的 AI 訓練使用 RLHF(從人類回饋中強化學習,Reinforcement Learning from Human Feedback):AI
做對了給獎勵,做錯了給懲罰,反覆調整直到表現更好。這個遊戲的設計刻意模仿了這個機制:
✓ 獎勵
放對格子:立即展開詳細說明,並顯示綠色通知。每次正確放置都是一個「正向強化」,讓你對這個步驟的印象更深刻。
✕ 懲罰
放錯格子:格子紅色閃爍、粒子爆炸,然後所有已完成的步驟全部重置,必須從頭開始。這對應 AI 訓練中的「負向懲罰」——錯誤代價越高,學習越有效。
★ 完成
全部放對:彈出完成視窗,右上角出現「再玩一次」按鈕。對應 AI
訓練中達到目標後的「episode 結束,記錄最佳策略」。