衛星首度自主辨識目標!AI 賦能太空觀測新紀元,從「下載數據」到「即時決策」
編輯核心觀點
- ✦太空觀測衛星首度在軌道上,僅憑 AI 視覺語言模型(VLM)自主尋找並辨識目標,無需地面人員介入。
- ✦此技術透過 NASA 開發的軟體套件,結合 Google DeepMind 的 Gemma 3 模型,能在衛星有限的硬體上運行,大幅提升太空感測器的實用性與價值。
- ✦未來有望實現「全天候巡邏」的太空監控能力,並為太空探索任務提供類似電影中的互動式 AI 助理。

過去,地球觀測衛星僅是將海量數據傳回地面,由人類分析師或機器學習演算法進行處理。然而,一項劃時代的里程碑於今年四月達成:太空基礎設施公司 Loft Orbital 的 Yam-9 衛星,首次在軌道上,僅憑自身搭載的 AI 軟體,便自主找到了它所尋找的目標,這標誌著 AI 視覺語言模型(Vision-Language Model, VLM)在太空應用的首次實際驗證,也預示著太空感測器能力與價值的根本性變革。
此次演示的核心是 Google DeepMind 開發的 Gemma 3 模型,這是一種專為「邊緣運算」(Edge Applications)設計的 VLM。這意味著它能夠在數據中心遙遠、硬體資源有限的環境下運行。VLM 結合了大型語言模型(LLM)的語境理解能力與影像分析能力。研究人員透過自然語言指令,要求模型分類「自然環境與人類開發交界處」的感測器數據,或識別「鐵路樞紐周邊的基礎設施」,模型均準確完成任務。
這項技術的意義重大,短期內,它能透過在軌道上進行初步的數據篩選(data triage),大幅減輕地面分析師需要處理的原始數據洪流,讓太空感測器更加實用。長遠來看,這更是未來在太空中部署更大規模 AI 基礎設施的關鍵驗證。
太空感測器迎來「全天候巡邏」新可能
Loft Orbital 的 AI 主管 Paul Lasserre 表示:「這為太空中的『全天候、巡邏層』打開了大門。如果你擁有一個 VLM,就能植入邏輯,例如『幫我監控這個邊境,一旦有可疑情況就通知我』,並能與衛星進行雙向互動。」
Loft Orbital 的衛星業務模式更接近「基礎設施即服務」(Infrastructure-as-a-Service, IaaS),而非傳統的衛星製造。該公司近期便與 EarthDaily 達成協議,為其建造、發射並操作六顆新的衛星,用於分析和銷售收集到的數據。Yam-9 衛星於 2025 年秋季發射,是 Loft Orbital 軌道 AI 專案的先導者,並搭載了 Nvidia Jetson Orrin AGX GPU,這是目前太空運算領域領先的晶片之一。
NASA噴射推進實驗室(JPL)AI 小組的技術領導者 Juan Delfa Victoria,主導開發了 NAVI-Orbital 軟體套件,該套件是 Gemma 3 VLM 的「駕馭者」。雖然 Gemma 3 是現成模型,但軟體工程師需要對套件進行精簡,以降低其所需的函式庫與記憶體佔用。
競逐太空 AI 應用,巨頭與新創紛紛布局
儘管這是 VLM 首次在軌道上被報導使用,但預期其他公司也將跟進。Planet Labs 公司營運著搭載 Jetson Orin 處理器的衛星,目前主要用於較簡單的物體偵測任務,但其發言人表示,公司正積極研究包括 VLM 在內的其他 AI 應用。
Kepler Communications 公司營運著全球最大的太空 GPU 集群,儘管因與合作夥伴簽訂保密協議(NDA)而無法透露是否已部署 VLM,但該公司指出,自其衛星於一月發射以來,「已有數個未公開的運算環境使用案例」。
Lasserre 補充道:「現在我們已經驗證了概念,這確實是未來的發展方向。」Loft Orbital 的目標是擴展其衛星星座,確保對地球任何地點的即時覆蓋,他估計這需要大約 50 到 100 顆像 Yam-9 這樣的衛星(Loft 目前在軌營運 12 顆衛星)。
在軌道上部署這些小型模型的經驗,將為公司未來嘗試部署更大規模的太空運算基礎設施提供寶貴經驗,尤其是在電力和記憶體管理等基礎但至關重要的領域。
AI 助理有望成為太空探索的得力助手
這項技術也可能為新的科學工具鋪平道路。NAVI-Space 的構想源自 JPL 研究員 Taran Cyriac John,他當時正思考為探索月球或火星的太空人提供數位助理。
Delfa Victoria 說明:「我們設想,太空人穿著加壓太空衣,無法方便地敲擊鍵盤,他們想做的任何事情都很複雜。那麼,我們能否提供一個類似於電玩或電影中的 AI 助理,可以進行互動?」
當然,這樣的 AI 助理不會被稱為 HAL 9000。



