球員組合的魔法：超圖理論如何同時替陣容打分數

你有沒有想過這個問題：Embiid 是 MVP 等級的球員，Harden 也是進攻機器，但他們兩個加在一起，是 1 + 1 = 2，還是 1 + 1 > 2？

這個問題聽起來直觀，但要用數字回答卻很困難。兩位來自北卡州立大學和威廉姆斯學院的統計學者，最近在論文中提出了一套基於「超圖」的新方法，試圖讓所有組合，從個人、雙人組、三人組，一路到完整的五人陣容，都能同時被評估、被排名。

先從 Plus-Minus 說起

評估籃球球員最直觀的方式之一，是看他上場的時候球隊贏了多少分、輸了多少分，這就是 Plus-Minus（正負值，PM）。一個球員的正負值是正的，代表他在場時球隊佔優；負的，代表他在場時球隊吃虧。

但 PM 有一個明顯的問題：好球員容易被好隊友帶起來，差球員也可能因為隊友太強而數字好看。

為了解決這個問題，統計學者發明了 Adjusted Plus-Minus（調整正負值，APM）。它用多元線性迴歸，在計算每個球員的貢獻時，同時把上場的其他九個人（包括對手）都考慮進去。這樣，每個球員的分數就是「排除隊友和對手因素之後，這個球員本身帶來的貢獻」。

APM 已經是目前球員個人評估的重要工具之一，但它還是有一個盲點。

APM 看不到的那件事

想像兩個場景：

場景 A：甲球員和乙球員單獨上場的時候都普普通通，但每次他們一起打，球隊就贏得不可思議。

場景 B：丙球員和丁球員各自都很強，但一起上場時彼此做球的習慣格格不入，效率反而下滑。

APM 的設計是讓每個球員有一個固定的「個人貢獻值」，整組人馬的預測表現就是把所有人的分數加起來。這個假設忽略了組合本身的化學效應，也就是球員之間的互動效果（interaction effect）。

有沒有辦法同時替個人打分，也替雙人組、三人組打分，並且讓這些分數彼此一致、不衝突？

這就是這篇論文要解決的問題。

超圖：把陣容變成數學物件

要理解這篇論文的方法，需要先接受一個視角的轉換。

一般的「圖」（graph）是由「節點」和「邊」組成的，一條邊連接兩個節點。籃球的標準 APM 設計矩陣，其實就等價於一種叫做 k 正則超圖（k-regular hypergraph）的數學物件。超圖的特別之處在於，它的邊可以同時連接兩個以上的節點。在這裡，每個球員是一個節點，每個上場陣容就是一條「超邊」，一次把五個節點連起來。

論文的關鍵洞見是：把這個超圖「擴展」一下，不只把五人陣容記下來，也把雙人組、三人組等各種規模的組合都加進去，就得到一個擴展超圖（extended hypergraph）。擴展超圖的關聯矩陣的轉置，正是一個「擴展版的 APM 設計矩陣」，其中每一行對應一個組合（個人或任意子組合），每一欄對應一個球員。

建立好這個框架之後，作者提出了兩種新的評分方法。

兩種新方法：HAPM 與 LAPM

HAPM：超圖調整正負值

HAPM（Hypergraph Adjusted Plus-Minus）的概念很直接：把擴展超圖的關聯矩陣拿來當設計矩陣，跑一個帶有正規化（ridge regression）的加權線性迴歸。

這個方法好在什麼地方？它的迴歸係數對應個人的貢獻，而每一行的「預測值（fitted value）」對應的就是那個組合的整體估計表現。想找最強的雙人組？把所有大小為 2 的組合的預測值排一排就好了。想找最強的三人組？同理。

整個計算過程和 APM 非常相似，差別只在於設計矩陣包含了所有規模的組合，而不只有完整的五人陣容。

LAPM：折線圖調整正負值

LAPM（Line Graph Adjusted Plus-Minus）走了一條更有意思的路。

把超圖轉換成它的折線圖（line graph）：把每個陣容組合當成節點，如果兩個組合有重疊的球員，就在它們之間連一條邊，邊的權重用 Jaccard 相似度來衡量（重疊球員數除以聯集球員數）。

有了這個折線圖，LAPM 用一個貝氏迴歸模型來估計每個節點的「預測正負值」，並且在先驗分布中加入圖的 Laplacian 矩陣，強迫相鄰節點的預測值要比較接近，也就是說，組成球員很類似的陣容，評分也應該接近。

這個設計讓 LAPM 的估計值在整個陣容網路中保持平滑，同時也能充分利用組合之間的結構關係來輔助估計。

拿 NBA 十年數據來驗證

兩位作者把 HAPM 和 LAPM 套用在 2012 年到 2022 年的 NBA 球季數據上，和幾個常用的進階指標（BPM、VORP、PER、WS/48）做相關性比較。

結果顯示：

HAPM 在個人排名上優於傳統 APM，和 BPM、PER、VORP 的相關性都更高。
LAPM 和 WS/48 的相關性最高，而 WS/48 是一個同時考量攻守兩端和贏球貢獻的指標，意義更完整。
兩個方法雖然都只用球隊層級的數據（沒有考慮對手），卻達到了和聯盟層級 APM（有考慮對手）差不多的準確度。
從跨賽季的穩定性來看，HAPM 和 LAPM 比 APM 的年度排名更一致，顯示新方法估計到的是較為穩定的能力指標。

案例：2021-22 費城 76 人

論文用 76 人隊那個賽季做了深入的個案分析，因為那年正好有一個有趣的變因：James Harden 在賽季中途被交易過來，只打了一半的賽季。

個人排名方面，HAPM 的前四名是 Embiid、Harden（並列第 2-3）、Maxey 與 Harris（並列第 3-4），符合大多數行家的直觀判斷。Harden 因為只上場 793 分鐘，PM 只有 +151，但 HAPM 仍然把他列為隊上前段班，說明模型確實能夠透過調整，還原出他真正的個人貢獻。

雙人組排名方面，HAPM 認為最強的雙人組是 Harden–Embiid，儘管他們一起上場的時間只有大約 600 分鐘。這和球隊的策略布局非常吻合：Harden 這個賽季的角色是組織者，而他和 Embiid 的雙核配合被公認是球隊進攻的核心。

另一個有趣的發現是 Embiid–Drummond 和 Embiid–Thybulle 的組合。這兩對的 PM 數字並不亮眼，但兩種方法的評價各有側重：Embiid–Drummond 在 HAPM 排第 7-14 名（偏前），LAPM 則排第 16 名；Embiid–Thybulle 在 LAPM 排第 5 名（相當靠前），HAPM 則排第 13 名。兩者的評分之所以高於 PM 的預期，可能的解釋是 Embiid 搭配防守型前鋒或中鋒時，有明顯的防守協同效應，但這屬於推測，論文並未直接下此結論。

從網路視覺化來看，Embiid 出現在前 15 強雙人組中的 12 組，以及所有前 15 強三人組之中。他是整個陣容網路的絕對核心，在圖裡就站在最中間的位置。這種視覺化方式讓教練能一眼看出誰是戰術核心，哪幾個組合特別有效率或特別低效。

這個研究的實際意義

這篇論文的貢獻不只是一個新的計算公式，而是提供了一個讓個人評估和組合評估真正接軌的框架。

過去，教練想評估一個球員的個人價值，看 APM 類指標；想評估一個特定陣容的整體表現，看那個陣容的 PM。但這兩組數字是各自為政的，無法互相比較，也無法從個人推導出組合的合理預測。

HAPM 和 LAPM 把這兩件事放在同一個迴歸框架裡，讓你可以同時問「Embiid 個人值多少分？」和「Embiid + Harden 這個組合值多少分？」，而且兩個問題的答案是一致的、不矛盾的。

對於球隊管理層，這種方法可以幫助評估一筆交易帶來的組合效應：除了「這個球員個人能貢獻什麼」，還能問「這個球員加進來之後，和現有陣容的化學反應如何」。後面這個問題，才真正影響勝敗。