Skyfaring
籃球賽場上兩隊多名球員在籃框附近的攻防走位
圖片:Logan Weaver | Unsplash
籃球數據分析NBA

球員組合的魔法:超圖理論如何同時替陣容打分數

HAPM 和 LAPM 把個人評估和組合評估放在同一個迴歸框架裡,讓你可以同時問『Embiid 個人值多少分?』和『Embiid + Harden 這個組合值多少分?』,而兩個問題的答案是一致的、不矛盾的。
AI 初稿 / skyfaring 編輯校正📅發布:2026年4月16日👁— 次瀏覽

你有沒有想過這個問題:Embiid 是 MVP 等級的球員,Harden 也是進攻機器,但他們兩個加在一起,是 1 + 1 = 2,還是 1 + 1 > 2?

這個問題聽起來直觀,但要用數字回答卻很困難。兩位來自北卡州立大學和威廉姆斯學院的統計學者,最近在論文中提出了一套基於「超圖」的新方法,試圖讓所有組合——從個人、雙人組、三人組,一路到完整的五人陣容——都能同時被評估、被排名。

先從 Plus-Minus 說起

評估籃球球員最直觀的方式之一,是看他上場的時候球隊贏了多少分、輸了多少分,這就是 Plus-Minus(正負值,PM)。一個球員的正負值是正的,代表他在場時球隊佔優;負的,代表他在場時球隊吃虧。

但 PM 有一個明顯的問題:好球員容易被好隊友帶起來,差球員也可能因為隊友太強而數字好看。

為了解決這個問題,統計學者發明了 Adjusted Plus-Minus(調整正負值,APM)。它用多元線性迴歸,在計算每個球員的貢獻時,同時把上場的其他九個人(包括對手)都考慮進去。這樣,每個球員的分數就是「排除隊友和對手因素之後,這個球員本身帶來的貢獻」。

APM 已經是目前球員個人評估的重要工具之一,但它還是有一個盲點。

APM 看不到的那件事

想像兩個場景:

場景 A:甲球員和乙球員單獨上場的時候都普普通通,但每次他們一起打,球隊就贏得不可思議。

場景 B:丙球員和丁球員各自都很強,但一起上場時彼此做球的習慣格格不入,效率反而下滑。

APM 的設計是讓每個球員有一個固定的「個人貢獻值」,整組人馬的預測表現就是把所有人的分數加起來。這個假設忽略了組合本身的化學效應——也就是球員之間的 互動效果(interaction effect)

有沒有辦法同時替個人打分,也替雙人組、三人組打分,並且讓這些分數彼此一致、不衝突?

這就是這篇論文要解決的問題。

超圖:把陣容變成數學物件

要理解這篇論文的方法,需要先接受一個視角的轉換。

一般的「圖」(graph)是由「節點」和「邊」組成的,一條邊連接兩個節點。籃球的標準 APM 設計矩陣,其實就等價於一種叫做 k 正則超圖(k-regular hypergraph) 的數學物件。超圖的特別之處在於,它的邊可以同時連接兩個以上的節點。在這裡,每個球員是一個節點,每個上場陣容就是一條「超邊」,一次把五個節點連起來。

論文的關鍵洞見是:把這個超圖「擴展」一下,不只把五人陣容記下來,也把雙人組、三人組等各種規模的組合都加進去,就得到一個 擴展超圖(extended hypergraph)。擴展超圖的關聯矩陣的轉置,正是一個「擴展版的 APM 設計矩陣」,其中每一行對應一個組合(個人或任意子組合),每一欄對應一個球員。

建立好這個框架之後,作者提出了兩種新的評分方法。

兩種新方法:HAPM 與 LAPM

HAPM:超圖調整正負值

HAPM(Hypergraph Adjusted Plus-Minus) 的概念很直接:把擴展超圖的關聯矩陣拿來當設計矩陣,跑一個帶有正規化(ridge regression)的加權線性迴歸。

這個方法好在什麼地方?它的迴歸係數對應個人的貢獻,而每一行的「預測值(fitted value)」對應的就是那個組合的整體估計表現。想找最強的雙人組?把所有大小為 2 的組合的預測值排一排就好了。想找最強的三人組?同理。

整個計算過程和 APM 非常相似,差別只在於設計矩陣包含了所有規模的組合,而不只有完整的五人陣容。

LAPM:折線圖調整正負值

LAPM(Line Graph Adjusted Plus-Minus) 走了一條更有意思的路。

把超圖轉換成它的 折線圖(line graph):把每個陣容組合當成節點,如果兩個組合有重疊的球員,就在它們之間連一條邊,邊的權重用 Jaccard 相似度 來衡量(重疊球員數除以聯集球員數)。

有了這個折線圖,LAPM 用一個貝葉斯迴歸模型來估計每個節點的「預測正負值」,並且在先驗分布中加入圖的 Laplacian 矩陣,強迫相鄰節點的預測值要比較接近——也就是說,組成球員很類似的陣容,評分也應該接近。

這個設計讓 LAPM 的估計值在整個陣容網絡中保持平滑,同時也能充分利用組合之間的結構關係來輔助估計。

拿 NBA 十年數據來驗證

兩位作者把 HAPM 和 LAPM 套用在 2012 年到 2022 年的 NBA 球季數據上,和幾個常用的進階指標(BPM、VORP、PER、WS/48)做相關性比較。

結果顯示:

  • HAPM 在個人排名上優於傳統 APM,和 BPM、PER、VORP 的相關性都更高。
  • LAPM 和 WS/48 的相關性最高,而 WS/48 是一個同時考量攻守兩端和贏球貢獻的指標,意義更完整。
  • 兩個方法雖然都只用球隊層級的數據(沒有考慮對手),卻達到了和聯盟層級 APM(有考慮對手)差不多的準確度。
  • 從跨賽季的穩定性來看,HAPM 和 LAPM 比 APM 的年度排名更一致,顯示新方法估計到的是較為穩定的能力指標。

案例:2021-22 費城 76 人

論文用 76 人隊那個賽季做了深入的個案分析,因為那年正好有一個有趣的變因:James Harden 在賽季中途被交易過來,只打了一半的賽季。

個人排名方面,HAPM 的前四名是 Embiid、Harden(並列第 2-3)、Maxey 與 Harris(並列第 3-4),符合大多數行家的直觀判斷。值得注意的是,Harden 因為只上場 793 分鐘,PM 只有 +151,但 HAPM 仍然把他列為隊上前段班——說明模型確實能夠透過調整,還原出他真正的個人貢獻。

雙人組排名方面,HAPM 認為最強的雙人組是 Harden–Embiid,儘管他們一起上場的時間只有大約 600 分鐘。這和球隊的策略布局非常吻合:Harden 這個賽季的角色是組織者,而他和 Embiid 的雙核配合被公認是球隊進攻的核心。

另一個有趣的發現是 Embiid–Drummond 和 Embiid–Thybulle 的組合。這兩對的 PM 數字並不亮眼,但兩種方法的評價各有側重:Embiid–Drummond 在 HAPM 排第 7-14 名(偏前),LAPM 則排第 16 名;Embiid–Thybulle 在 LAPM 排第 5 名(相當靠前),HAPM 則排第 13 名。兩者的評分之所以高於 PM 的預期,可能的解釋是 Embiid 搭配防守型前鋒或中鋒時,有明顯的防守協同效應,但這屬於推測,論文並未直接下此結論。

從網絡可視化來看,Embiid 出現在前 15 強雙人組中的 12 組,以及所有前 15 強三人組之中。他是整個陣容網絡的絕對核心,在圖裡就站在最中間的位置。這種視覺化方式讓教練能一眼看出誰是戰術核心,哪幾個組合特別有效率或特別低效。

這個研究的實際意義

這篇論文的貢獻不只是一個新的計算公式,而是提供了一個讓個人評估和組合評估真正接軌的框架。

過去,教練想評估一個球員的個人價值,看 APM 類指標;想評估一個特定陣容的整體表現,看那個陣容的 PM。但這兩組數字是各自為政的,無法互相比較,也無法從個人推導出組合的合理預測。

HAPM 和 LAPM 把這兩件事放在同一個迴歸框架裡,讓你可以同時問「Embiid 個人值多少分?」和「Embiid + Harden 這個組合值多少分?」,而且兩個問題的答案是一致的、不矛盾的。

對於球隊管理層,這種方法可以幫助評估一筆交易帶來的組合效應——不是只問「這個球員個人能貢獻什麼」,而是「這個球員加進來之後,和現有陣容的化學反應如何」。這才是真正影響勝敗的問題。