Skyfaring
一名士兵與一輛偵察用無人地面車輛在夜間執行偵察任務
圖片:U.S. Marine Corps / Cpl. Charles Santamaria
無人系統AI軍事路徑規劃

最短的路,存活率是零:戰場無人車怎麼學會繞遠路。

同一張地圖,同一個起點和終點。最快的路線四點四五公里,二十分鐘就到,存活率是零。繞了三倍遠的那條路要走超過兩小時,存活率才勉強三成六。
AI 初稿 / skyfaring 編輯校正📅發布:2026年6月3日👁— 次瀏覽

規劃官在筆電前,地圖上只有兩個點:一個起點,一個目標。他先畫了一條直線。

系統算完,跳出三個數字。距離四點四五公里,時間不到二十分鐘,抵達時不被發現的機率,零。

接著系統自己畫了第二條路。它繞著作戰區的外圍走了一大圈,十三點一七公里,要走超過兩個小時。這條路的存活機率,三成六。

同一張地圖,同一輛車,同一個目的地。為什麼會有指揮官願意讓無人車多跑三倍的路,晚兩個小時抵達?

看得見的戰場

答案藏在現代戰場的一個前提裡:凡是會動的,都可能被偵測、被追蹤、被瞄準。

在感測器密布的環境下,活下來靠的不是火力,而是減少暴露、保持機動、對威脅快速反應。無人地面車輛(UGV)正是在這個前提下變成關鍵能力。它替指揮官延伸作戰範圍,深入危險區域,而不必讓士兵直接暴露在火線上。

問題是,現在多數 UGV 仍然是單一任務的工具。一輛後勤車能照預定路線把補給送到,卻無法在路上突然遇到威脅時自己改道;一個偵察平台能蒐集資料,卻不懂得聰明地避開偵測。

這篇來自葡萄牙陸軍官校與里斯本大學高等技術學院的論文,作者 Nuno Soares 與 António Grilo 點出,真正缺的不是又一套導航演算法,而是一個能把指揮官的意圖、戰場的動態、時間與風險之間的取捨,一起翻譯成可執行行動的規劃框架。

他們把這套框架叫做 ARGUS。

威脅不是一個點

ARGUS 吃三種輸入:地理空間資料(高程、地形、障礙)、軍事情報(威脅的位置與特性),以及指揮官的意圖(目標與限制)。它把這三樣東西揉成一張覆蓋整個作戰區的風險地圖。

關鍵在於它怎麼描述威脅。

多數規劃方法把敵方的位置當成確定的座標。ARGUS 不這樣做。它把每一個威脅表示成一張「位置機率分布」,攤在離散化的網格上,每一格都標著該處存在威脅的機率。情報從來不是精確的,這種寫法把不確定性直接寫進模型裡。

被偵測的機率則隨距離變化。雷達偵測理論告訴我們,偵測機率對距離呈現一條 S 形曲線:近距離幾乎必然被發現,超過有效距離則趨近於零,中間是一段平滑下降。ARGUS 用一個參數化的函數逼近這條曲線,計算便宜,又保留了真實的物理形狀。

把多個威脅疊加起來,用的是「存活機率連乘」的算法。每經過一格,車輛活下來的機率是各個威脅都沒發現它的機率相乘。

還有一個常被忽略的細節:車輛不是一個點。一支編隊有寬度。ARGUS 用最壞情況來處理,在編隊走廊的範圍內取風險最高的那一格作為代表,確保整支隊伍都不超過暴露上限。指揮官指定的編隊寬度決定了這個走廊有多寬。論文的測試用的是三百公尺。

這張風險地圖有個技術難關。存活機率是連乘的,而 A* 這類最短路徑演算法只能處理相加的成本。ARGUS 的解法是取對數:把連乘變成相加,數學上等價,卻能讓圖搜尋演算法直接運作。最大化存活,就轉成了最小化累積的對數風險。

三種模式,三種意圖。

有了風險地圖,接下來是把指揮官的意圖變成一道最佳化問題。ARGUS 提供三種模式。

平衡模式,在「正規化的時間」和「正規化的風險」之間取一個加權組合,權重由參數 α 控制。α 等於零是最安全,α 等於一是最快。論文開頭那兩條路,正是這個參數推到兩個極端的結果。

快速但限風險模式,目標是在每一格的風險都不超過某個上限的前提下,把時間壓到最短。把風險天花板訂太低,直線路被判定不可行,系統會啟動退路機制。

安全但限時間模式,反過來,在總任務時間不超過預算的前提下,找風險最低的路。這一種最難算。它本質上是一個資源限制最短路徑問題(RCSPP),數學上屬於 NP-hard,標準的最短路徑演算法在這裡力不從心。

第三種模式的價值,在一組數字裡看得最清楚。任務時間預算給三十分鐘,系統找到的路線存活率只有百分之二點二九。預算放寬到四十分鐘,多出來的十分鐘讓演算法找到一條更迂迴、更隱蔽的路,存活率跳到百分之十二點零六,整整五倍。

時間就是這樣換來的安全。多給一點餘裕,車輛就能多繞開一些被看見的角落。

為什麼要自己寫一套演算法?

第三種模式既然是 NP-hard,研究者一開始試了傳統的多目標演算法,那類方法會明確算出時間與風險之間的整條柏拉圖前緣。在這篇論文用的大規模地圖上,它們慢到無法在可接受的時間內給出答案。

於是作者開發了一套專用的演算法,叫 APULSE。名字來自 A* 與 Pulse 的結合。它靠三個機制撐起效能。

第一是啟發式的預先計算。正式搜尋之前,APULSE 先從目標點反向算出兩張地圖:從任一點到目標的最短時間,以及最低累積風險。這兩個下界讓後面的搜尋有了方向感,知道哪些路根本不值得試。

第二是積極的剪枝。搜尋過程中,只要一條路徑的剩餘時間加起來會超過時間預算,立刻丟棄;只要它的估計總風險已經比目前最好的解還差,也立刻丟棄。

第三是時間分桶。連續的時間軸被切成固定寬度的區間,每一個(節點,時間桶)的組合只保留風險最低的那一條路徑,其餘視為被支配而剪掉。桶的寬度由一個自動調校的公式決定,大約是時間預算除以八千一百九十二,不需要人工校準。

效果在大規模測試裡很明顯。研究者把 APULSE 跟三套目前最先進的參考演算法放在同一張地圖上比,地圖最大有四萬六千個節點。小規模時,參考演算法因為初始化負擔小而領先。但從中等規模開始,APULSE 的執行時間就一路最低;到了最大的那個案例,它是唯一一套能在十分鐘上限內跑完所有設定的演算法,兩套雙向搜尋的對手直接失敗。

速度快,品質卻沒有犧牲。在全部二十六個基準設定裡,APULSE 有二十五個找到的就是精確最佳解。唯一的例外,誤差只有百分之零點零零二五,來自時間分桶帶來的離散化,幾乎可以忽略。

路走到一半,冒出新威脅。

靜態的計畫在真實戰場上撐不久。新的情報隨時可能讓原本算好的路失效。

最直接的反應是整條路重算,但這很浪費,因為大部分地圖並沒有改變。ARGUS 的做法是局部修補:只重算受影響的那一段,範圍由威脅距離、半個編隊寬度,加上一個可設定的安全餘裕決定。

研究者用實驗驗證了這個機制。原本算好的七條基準路線,各自在中途被塞進一組新威脅,逼系統就地修補。結果呈現一個清楚的取捨。修補後的路線一致地提高了存活率,在安全限時模式裡,對數風險最多下降了三成。代價是時間,同樣那些任務,局部繞行讓總時長最多增加了五成。

要冒險繞遠保命,還是守住時程,這個決定不交給機器。ARGUS 讓指揮官設定一個時間餘裕參數,控制修補時能偏離原訂時程多少。餘裕大,准許更安全但更長的繞道;餘裕小,逼系統盡量守住原本的進度。人的判斷權留在人手上。

從螢幕到車上

這套系統不只停在模擬裡。

研究者把 ARGUS 做成一個用 Python 寫的完整原型,配上互動式的操作介面。規劃官在地圖上放下起點和終點,選一種模式,拉一下編隊寬度的滑桿,系統就回傳一條路,連同總距離、預估時間、存活機率等指標,還有一張把風險畫成熱度的地圖,解釋這條路為什麼這樣走。

真正的考驗在葡萄牙陸軍的 ARTEX 25 演習。團隊用一輛名為 Vigilant 的遙控偵察 UGV 做測試。ARGUS 算好並驗證一條路之後,把它輸出成標準的航點檔,匯入到實際操控這輛車的任務管制軟體 QGroundControl。整條從規劃到執行的鏈路就此打通,證明這套系統產出的路線可以直接被前線的控制系統使用。

演習還帶出一個意外的收穫。那條為了計算編隊寬度而保留的走廊,除了反映車輛的實體尺寸,也順便給了操作員一塊事先核可過的機動餘地,讓他們在執行時能做些微小的即時調整。

還沒算進去的事

論文沒有假裝問題都解決了。

它建立在一些簡化的假設上:地形資料是靜態的,感測器模型是理想化的。這些都是後續要補的方向。作者列出的下一步包括把遮蔽和動態因素寫進風險模型,接上即時的資料串流,再把能源和車輛本身的限制也納入最佳化。

但這套框架真正的貢獻,或許不在於它能算出哪一條路最好。

回到開頭那兩條路。四點四五公里的直線,二十分鐘,存活率零。十三點一七公里的大圈,兩個多小時,存活率三成六。ARGUS 沒有替指揮官做選擇,它做的是把這個取捨攤開來看,把「最短」這個直覺底下藏著的代價標成具體的數字。

在一個凡動必被看見的戰場上,最短的路和能活著抵達的路,很少是同一條。一套規劃系統能做的,是讓人在按下執行之前,清楚知道自己正在拿什麼換什麼。