
三十架無人機衝過來,你怎麼擋?AAMAS 2026 論文解析。
論文最有意思的發現:有效的防禦策略靠的是整套配置的協同,而不是每架無人機各自有多強。把隊伍拆開、逐架重新挑選規則,成功率反而崩潰——說明群體的合作不能簡化成零件的加總。
想像一個場景:一片開放地帶,角落有一個需要守護的重要設施。三十架攻擊無人機從不同方向出發,路徑帶著不規則的弧形,彼此互相協調。你有四十五架防禦無人機可以調動。
你要怎麼分配它們?
這不是遊戲。這是目前無人機防禦研究正在面對的核心問題,也是澳洲阿德萊德大學和 Saab Australia 在今年 AAMAS 2026 發表的這篇論文所嘗試回答的問題。
AAMAS:這個領域最重要的年度聚會
在解讀論文之前,值得先認識這個會議。
AAMAS(International Conference on Autonomous Agents and Multiagent Systems,自主智能體與多智能體系統國際會議)是多智能體 AI 領域最頂尖的學術會議,每年舉辦一屆。今年是第 25 屆,五月下旬在賽普勒斯的帕福斯(Paphos)舉行。
這個會議的研究範圍很廣——機器人群體協調、分散式人工智慧、賽局理論、自動協商、多智能體強化學習,都是 AAMAS 的核心主題。簡單說,凡是「多個 AI 如何在一起工作」的問題,大多會在這裡出現。
今年入選的這篇論文,主題正好是最貼近現實應用的那一種:如何用 AI 協調大規模無人機防禦群。
問題的核心:組合爆炸
回到剛才那個場景。
防禦者面對的問題不是「每架無人機做什麼」這麼簡單,而是「四十五架無人機如何分工、各自對抗哪些攻擊者、又怎麼互相配合」——這是一個組合爆炸的問題。
即使只有十架防禦無人機,可能的配置方式已經多得無法窮舉。隨著數量增加,暴力搜索徹底失效。
強化學習(Reinforcement Learning,RL)看起來是個解法,但有幾個根本限制。訓練需要龐大的模擬資料量,訓練時環境中的其他智能體也一直在改變策略(這叫做非穩態問題),而且訓練出來的模型往往只在特定規模下有效——換了場景尺度就得重來。現有文獻裡,大多數研究測試的規模不超過 10 對 10;這篇論文的目標是 30 對 45,差距相當大。
分解邏輯:先打小仗,再組大軍。
這篇論文的核心策略是一個四階段的分解框架,把看似不可解的大規模問題,拆成可以處理的小問題,再有系統地組合回去。
整個框架用的不是神經網路,而是啟發式規則(heuristics)。每架防禦無人機執行一條規則——例如「攔截最近的攻擊者」、「繞著目標巡邏」、「優先處理威脅等級最高的目標」。這些規則有的是研究者手寫的,有的是用大型語言模型自動生成的,並且都可以用緊湊的數學形式表達、在 JAX 環境下高效運行。
第一階段:小規模演化
先用遺傳演算法(GA)在小規模場景下演化有效策略。紅方一到五架攻擊者、藍方一到八架防禦者——這個規模可以跑大量模擬,讓演算法在有限計算資源下找出哪些啟發式規則組合有效。
每個「染色體」代表一個完整的藍隊配置:每架無人機的規則、出發位置、規則的特定參數。演化結束後,系統對不同小規模對戰情境都有一張「成功率熱圖」。
第二階段:動態規劃放大
有了小規模的成功率資料,第二階段用動態規劃(DP)把這些資料組合成大規模策略。
核心想法是:把三十架攻擊者視為可以分拆的子群。例如 30 可以拆成 {10, 10, 10} 或 {12, 9, 9},每個子群分別由一支小防禦隊對付。DP 從第一階段的熱圖查出各種小規模配置的成功率,在多項式時間內算出最佳分拆方式。
暴力搜索的複雜度是貝爾數(Bell number),趨近超指數成長;DP 的最壞情況是 O(R³B³),R 和 B 分別是紅藍方數量。這個差距,是能算和不能算的分野。
第三階段:組合全隊
動態規劃告訴你「把三名防禦者分去對付五名攻擊者」,但它沒有告訴你要用哪三名——更精確說,哪個在第一階段演化出的小隊組合最合適。
第三階段從第一階段的高分染色體庫裡取樣,按照第二階段的分拆方案,拼出完整的大隊配置,接著在完整的大規模模擬環境裡直接跑一遍、取得真實成績。
第四階段:回饋精煉
最後,把大規模模擬的結果回饋給第一階段的成功率估計。那些在小規模看起來很強、放到大場景卻失靈的組合,得分會被調低;反過來,在大規模仍然穩定發揮的組合,地位上升,成為下一輪取樣的優先候選。
這個反覆精煉讓整個系統越跑越準。
數字說了什麼?
論文設計了兩條基準線對比:純隨機配置、和不用分解邏輯直接對大規模場景跑 GA。
結果非常明確。
在 20 架攻擊者、藍紅比 1.5 的情境下,GA 基準線最佳染色體的勝率只有 0.13;加入 DP 分解的第三階段之後,同樣情境的勝率提升到 0.69。
面對最嚴苛的 30 架攻擊者,基準線幾乎毫無勝算,勝率徘徊在接近零;完整四階段框架下,前 10% 染色體的平均勝率達到 0.23,最佳染色體達到 0.52。從接近零到超過五成,這個差距說明了分解邏輯的實質效果。
最有意思的發現:染色體不能拆
論文有一個讓人印象深刻的副實驗。
研究者試著在第三階段改用「基因層級」的取樣——不保留完整染色體,而是把各個無人機的個別基因重新拼湊。結果成效明顯下滑。
這暗示了一件事:有效的防禦策略靠的是整套配置的協同,而不是每架無人機各自有多強。某條規則單獨看起來普通,放在對的隊伍組合裡卻可能是關鍵的那一塊;反過來,在小規模表現亮眼的規則,在大場景裡可能反而互相干擾。把隊伍拆開、逐架重新挑選規則,結果比保留整套配置差很多。
研究者用「共現網路圖」呈現這個現象:在高分策略裡,特定幾條規則總是一起出現——「預測性攔截」(Predictive Interception)和「威脅等級評估」(Threat-Level Assessment)是最常見的核心組合,有時搭配「目標繞圈」或「旋轉巡邏」。這個結構在直接跑 GA 的小規模場景裡清晰可見,但一旦規模放大、跳過分解邏輯,結構就消失了。
完整的四階段框架讓這個結構重新浮現。
這意味著什麼?
這篇論文的貢獻不只在技術數字上。它示範了一種應對大規模多智能體問題的思維:與其讓 AI 直接面對無法處理的複雜度,不如先在可控的小規模下學習有用的結構,再用數學工具把這個結構擴張到更大的場景。
這個邏輯本身不是新的——模組化演化、動態規劃在多智能體研究裡都有先例。但這篇論文把它們整合進一個完整的管線,並且在規模上做到了前人沒到達過的地方:30 對 45,穩定運行,不需要 GPU 上的神經網路推理。
限制也同樣真實。目前的模型假設完全可觀測(每架無人機知道所有對手的位置),攻擊者的路徑雖然不規則但也不會學習反制。真實戰場的複雜度遠超這些條件。
但作為一個研究方向的起點,它在 AAMAS 2026 的舞台上給了一個清晰的示範:大規模群體 AI 的問題,可以透過有系統的分解找到出路。