手機 AI 運算太吃記憶體？KAIST 開發「Upsample Anything」技術，效能提升 16 倍

手機視覺 AI 的記憶體困境

智慧型手機受限於散熱與記憶體空間，難以像大型 AI 硬體般隨意擴充運算資源。然而，隨著相機功能、物體辨識與在地感知任務日益普及，手機晶片面臨巨大的 GPU 記憶體壓力。為了維持處理速度，手機通常會對影像進行壓縮，但這往往導致細節流失，使得系統難以辨識細微邊緣或小型物體。

韓國科學技術院（KAIST）的研究團隊開發出「Upsample Anything」技術，旨在解決上述問題。這項技術的核心在於不強迫 AI 視覺管線從一開始就以高解析度執行。相反地，它先處理低解析度的特徵圖，再利用輸入影像的邊緣與結構資訊，重建出高解析度的特徵。

這項方法的優勢在於其「無需訓練（training-free）」的特性，開發者無須針對新資料進行額外的模型訓練，使其能更靈活地應用於不同環境。根據研究數據，該技術能將 GPU 記憶體需求降低高達 16 倍，同時讓視覺資訊恢復至接近原始影像的品質。

在研究測試中，團隊使用 224 x 224 的常見 AI 研究影像尺寸進行實驗，計算時間約為 0.4 秒。雖然這尚未達到手機相機 App 的即時運算標準，但已為行動裝置的 AI 效能優化提供了明確的效率指標。

目前該研究已發表於 arXiv 並獲 CVPR 2026 接受，因其在運算效率與研究透明度上的表現受到關注。接下來的關鍵挑戰在於實際部署，手機製造商與應用開發者必須證明，這種更銳利的在地視覺處理技術，不會在實際行動硬體上引發電池續航、發熱或延遲問題。