
夾擊與換防:機器讀懂 NBA 防守的語言
進攻時間剩 20 至 24 秒的時段,夾擊出現的頻率達到 70.3%。這個時間點對應的是控球方剛拿到球、開始組織進攻的初期,防守方選擇在進攻布陣還未完成前主動施壓。相比之下,進攻時間剩最後 0 至 10 秒,夾擊頻率跌到 8.3%,換防也只剩 15.2%。時間快到了,防守反而趨於保守,不再主動換人或夾擊,避免製造空位讓對手在絕望中找到出口。
比賽剩最後兩分鐘,比數差三分。控球後衛帶球推進到弧頂,兩名防守球員同時朝他靠攏,距離縮短到一公尺半以內。旁觀者知道這是夾擊,教練也知道。問題是,在一個賽季三萬多次的攻守輪換裡,這種動作發生了幾次、在哪裡發生、對哪些對位有效,人工逐一標記,根本追不上。
SportVU 系統解決了資料問題的前半段。STATS LLC 開發的這套追蹤技術,透過架設在場館的多架攝影機,每秒捕捉所有球員和球的位置二十五次。2012-13 球季,系統記錄了大約 630 場比賽,產出的資料切分成 32,377 段攻守輪換,每一段都有球員位置、時間戳記、速度等完整時序資訊。
有了這些數字,問題才算真正開始。
蘇州科技大學的李建龍,在今年發表於《Scientific Reports》的研究裡,嘗試用機器學習解決後半段:自動識別防守動作。他鎖定的對象是籃球防守中最常見的兩種戰術:換防(switch)和夾擊(trap)。
換防發生在擋拆之後。當進攻方利用掩護製造空間時,兩名防守球員彼此交換負責對象,確保沒有漏人。夾擊是另一回事:兩名防守球員同時向控球者施壓,目標是逼迫失誤、斷球,或讓他在狹小空間倉促傳球。這兩種動作在肉眼下並不難辨認,但讓機器讀懂,牽涉的細節遠比表面複雜。
把直覺拆成門檻
李建龍採用的是 LSTM 和 CNN 的混合模型。LSTM 處理時間序列,學習球員在連續幀之間的位移規律;CNN 處理空間結構,把半場劃分成 400×360 的格狀網格,讓模型識別防守陣型的密度和相對位置。兩者的輸出向量合併後,再接一層全連接層做最終分類。
要識別換防,模型的判斷邏輯是:進攻方兩名球員在三個連續幀內距離是否小於 1.5 公尺(代表掩護成立),以及防守方是否在 0.8 秒內完成位置交換。要識別夾擊,關鍵指標是防守球員向控球者的收縮速度,以及在特定半徑內同時逼近的防守者數量。
這些判斷標準,在人工標記中都只是教練腦子裡的直覺。模型把直覺拆成了可量化的門檻。
防守策略的時空規律
數據揭露了幾個有意思的模式。
進攻時間剩 20 至 24 秒的時段,夾擊出現的頻率達到 70.3%。這個時間點對應的是控球方剛拿到球、開始組織進攻的初期,防守方選擇在進攻布陣還未完成前主動施壓。相比之下,進攻時間剩最後 0 至 10 秒,夾擊頻率跌到 8.3%,換防也只剩 15.2%。時間快到了,防守反而趨於保守,不再主動換人或夾擊,避免製造空位讓對手在絕望中找到出口。
空間分布同樣有明顯偏好。換防高度集中在弧頂附近,因為那裡是擋拆最頻繁發生的位置。夾擊則偏向底線角落和側翼邊線,這些地方讓控球者被逼進死角,傳球路線最少。
兩種策略的強度差異,一個距離數字說得最直接:夾擊時防守球員與控球者的平均距離是 1.5 公尺,換防時是 2.8 公尺,接近了將近一半。
到了關鍵時刻(最後五分鐘且分差在五分以內),模式更清楚。夾擊在弧頂和底線角落的密度顯著上升,換防則更有策略性地分散,集中對抗外線投射威脅。壓力越大,兩種戰術的使用邏輯越涇渭分明。
模型的成績單
混合模型的整體準確率達到 91.4%,高於單獨使用 LSTM 的 85.3%、CNN 的 87.5%,以及隨機森林基準模型的 82.7%。
與過去研究相比,差距更明顯。Tian 等人在 2019 年用類似的混合架構分析 2018 年 NBA 季後賽的防守夾擊,準確率是 86%;Hobbs 用 CNN 識別聯防,達到 85%。這篇研究的 91.4%,是現有同類文獻中最高的。
模型標記結果與人工標記的一致性,用 Cohen's Kappa 衡量,數值是 0.86。這個分數代表高度吻合。機器看到的防守動作,跟人眼看到的大部分時候是同一件事。
工具的邊界
研究者也誠實說明了限制。SportVU 資料只覆蓋半場,全場人盯人防守和快攻轉換都無法分析。模型在同一攻守輪換裡只能辨認一種主要策略,如果夾擊在過程中演變成換防,這種交疊目前讀不出來。速度、距離等空間門檻是固定的,對於垂墜式防守這類不同邏輯的策略,準確率也會下降。
這些限制並不讓結論失效。只是劃出了這套工具目前能做什麼、還不能做什麼的界線。
換防和夾擊背後的時機選擇和空間偏好,在三萬多筆數據裡是有規律的。防守策略從來不是神秘的,只是以前沒有足夠快的工具把它讀清楚。現在有了,它讀出來的東西,跟教練的直覺大部分吻合,只是比教練快,也比教練的記憶完整。