三十架無人機衝過來，你怎麼擋？AAMAS 2026 論文解析。

想像一個場景：一片開放地帶，角落有一個需要守護的重要設施。三十架攻擊無人機從不同方向出發，路徑帶著不規則的弧形，彼此互相協調。你有四十五架防禦無人機可以調動。

你要怎麼分配它們？

這不是遊戲。這是目前無人機防禦研究正在面對的核心問題，也是澳洲阿德萊德大學和 Saab Australia 在今年 AAMAS 2026 發表的這篇論文所嘗試回答的問題。

AAMAS：這個領域最重要的年度聚會

先認識這個會議。

AAMAS（International Conference on Autonomous Agents and Multiagent Systems，自主代理人與多代理人系統國際會議）是多代理人 AI 領域最頂尖的學術會議，每年舉辦一屆。今年是第 25 屆，五月下旬在賽普勒斯的帕福斯（Paphos）舉行。

這個會議的研究範圍很廣，機器人群體協調、分散式人工智慧、賽局理論、自動協商、多代理人強化學習，都是 AAMAS 的核心主題。簡單說，凡是「多個 AI 如何在一起工作」的問題，大多會在這裡出現。

今年入選的這篇論文，主題正好是最貼近現實應用的那一種：如何用 AI 協調大規模無人機防禦群。

問題的核心：組合爆炸

回到剛才那個場景。

防禦者面對的問題是「四十五架無人機如何分工、各自對抗哪些攻擊者、又怎麼互相配合」，一個組合爆炸的問題。

即使只有十架防禦無人機，可能的配置方式已經多得無法窮舉。隨著數量增加，暴力搜索徹底失效。

強化學習（Reinforcement Learning，RL）看起來是個解法，但有幾個根本限制。訓練需要龐大的模擬資料量，訓練時環境中的其他代理人也一直在改變策略（這叫做非穩態問題），而且訓練出來的模型往往只在特定規模下有效，換了場景尺度就得重來。現有文獻裡，大多數研究測試的規模不超過 10 對 10；這篇論文的目標是 30 對 45，差距相當大。

分解邏輯：先打小仗，再組大軍。

這篇論文的核心策略是一個四階段的分解框架，把看似不可解的大規模問題，拆成可以處理的小問題，再有系統地組合回去。

整個框架用的不是神經網路，而是啟發式規則（heuristics）。每架防禦無人機執行一條規則，例如「攔截最近的攻擊者」、「繞著目標巡邏」、「優先處理威脅等級最高的目標」。這些規則有的是研究者手寫的，有的是用大型語言模型自動生成的，並且都可以用緊湊的數學形式表達、在 JAX 環境下高效運行。

第一階段：小規模演化

先用遺傳演算法（GA）在小規模場景下演化有效策略。紅方一到五架攻擊者、藍方一到八架防禦者，這個規模可以跑大量模擬，讓演算法在有限計算資源下找出哪些啟發式規則組合有效。

每個「染色體」代表一個完整的藍隊配置：每架無人機的規則、出發位置、規則的特定參數。演化結束後，系統對不同小規模對戰情境都有一張「成功率熱圖」。

第二階段：動態規劃放大

有了小規模的成功率資料，第二階段用動態規劃（DP）把這些資料組合成大規模策略。

核心想法是：把三十架攻擊者視為可以分拆的子群。例如 30 可以拆成 {10, 10, 10} 或 {12, 9, 9}，每個子群分別由一支小防禦隊對付。DP 從第一階段的熱圖查出各種小規模配置的成功率，在多項式時間內算出最佳分拆方式。

暴力搜索的複雜度是貝爾數（Bell number），趨近超指數成長；DP 的最壞情況是 O(R³B³)，R 和 B 分別是紅藍方數量。這個差距，是能算和不能算的分野。

第三階段：組合全隊

動態規劃告訴你「把三名防禦者分去對付五名攻擊者」，但它沒有告訴你要用哪三名，更精確說，哪個在第一階段演化出的小隊組合最合適。

第三階段從第一階段的高分染色體庫裡取樣，按照第二階段的分拆方案，拼出完整的大隊配置，接著在完整的大規模模擬環境裡直接跑一遍、取得真實成績。

第四階段：回饋精煉

最後，把大規模模擬的結果回饋給第一階段的成功率估計。那些在小規模看起來很強、放到大場景卻失靈的組合，得分會被調低；反過來，在大規模仍然穩定發揮的組合，地位上升，成為下一輪取樣的優先候選。

這個反覆精煉讓整個系統越跑越準。

數字說了什麼？

論文設計了兩條基準線對比：純隨機配置、和不用分解邏輯直接對大規模場景跑 GA。

結果非常明確。

在 20 架攻擊者、藍紅比 1.5 的情境下，GA 基準線最佳染色體的勝率只有 0.13；加入 DP 分解的第三階段之後，同樣情境的勝率提升到 0.69。

面對最嚴苛的 30 架攻擊者，基準線幾乎毫無勝算，勝率徘徊在接近零；完整四階段框架下，前 10% 染色體的平均勝率達到 0.23，最佳染色體達到 0.52。從接近零到超過五成，這個差距說明了分解邏輯的實質效果。

最有意思的發現：染色體不能拆

論文有一個讓人印象深刻的副實驗。

研究者試著在第三階段改用「基因層級」的取樣，不保留完整染色體，把各個無人機的個別基因重新拼湊。結果成效明顯下滑。

這暗示了一件事：有效的防禦策略靠的是整套配置的協同，而不是每架無人機各自有多強。某條規則單獨看起來普通，放在對的隊伍組合裡卻可能是關鍵的那一塊；反過來，在小規模表現亮眼的規則，在大場景裡可能反而互相干擾。把隊伍拆開、逐架重新挑選規則，結果比保留整套配置差很多。

研究者用「共現網路圖」呈現這個現象：在高分策略裡，特定幾條規則總是一起出現，「預測性攔截」（Predictive Interception）和「威脅等級評估」（Threat-Level Assessment）是最常見的核心組合，有時搭配「目標繞圈」或「旋轉巡邏」。這個結構在直接跑 GA 的小規模場景裡清晰可見，但一旦規模放大、跳過分解邏輯，結構就消失了。

完整的四階段框架讓這個結構重新浮現。

這篇論文說明了什麼

這篇論文的貢獻不只在技術數字上。它示範了一種應對大規模多代理人問題的思維：與其讓 AI 直接面對無法處理的複雜度，不如先在可控的小規模下學習有用的結構，再用數學工具把這個結構擴張到更大的場景。

這個邏輯有先例，模組化演化、動態規劃在多代理人研究裡都出現過。這篇論文把它們整合進一個完整的管線，並且在規模上做到了前人沒到達過的地方：30 對 45，穩定運行，不需要 GPU 上的神經網路推理。

限制也同樣真實。目前的模型假設完全可觀測（每架無人機知道所有對手的位置），攻擊者的路徑雖然不規則但也不會學習反制。真實戰場的複雜度遠超這些條件。

但作為一個研究方向的起點，它在 AAMAS 2026 的舞台上給了一個清晰的示範：大規模群體 AI 的問題，可以透過有系統的分解找到出路。