手機 AI 運算太吃記憶體?KAIST 開發「Upsample Anything」技術,效能提升 16 倍
編輯核心觀點
- ✦韓國科學技術院(KAIST)研發出名為「Upsample Anything」的新技術,能重建高解析度視覺特徵,解決手機 AI 處理影像時的記憶體瓶頸。
- ✦該技術透過低解析度特徵圖進行運算,不僅無需重新訓練模型,還能將 GPU 記憶體需求降低高達 16 倍。
- ✦目前該研究已獲 CVPR 2026 認可,未來有望協助手機在不增加過多功耗與熱量的前提下,強化相機與即時感知功能。

手機視覺 AI 的記憶體困境
智慧型手機受限於散熱與記憶體空間,難以像大型 AI 硬體般隨意擴充運算資源。然而,隨著相機功能、物體辨識與在地感知任務日益普及,手機晶片面臨巨大的 GPU 記憶體壓力。為了維持處理速度,手機通常會對影像進行壓縮,但這往往導致細節流失,使得系統難以辨識細微邊緣或小型物體。
Upsample Anything:無需重訓的輕量化方案
韓國科學技術院(KAIST)的研究團隊開發出「Upsample Anything」技術,旨在解決上述問題。這項技術的核心在於不強迫 AI 視覺管線從一開始就以高解析度執行。相反地,它先處理低解析度的特徵圖,再利用輸入影像的邊緣與結構資訊,重建出高解析度的特徵。
這項方法的優勢在於其「無需訓練(training-free)」的特性,開發者無須針對新資料進行額外的模型訓練,使其能更靈活地應用於不同環境。根據研究數據,該技術能將 GPU 記憶體需求降低高達 16 倍,同時讓視覺資訊恢復至接近原始影像的品質。
邁向實機部署的挑戰
在研究測試中,團隊使用 224 x 224 的常見 AI 研究影像尺寸進行實驗,計算時間約為 0.4 秒。雖然這尚未達到手機相機 App 的即時運算標準,但已為行動裝置的 AI 效能優化提供了明確的效率指標。
目前該研究已發表於 arXiv 並獲 CVPR 2026 接受,因其在運算效率與研究透明度上的表現受到關注。接下來的關鍵挑戰在於實際部署,手機製造商與應用開發者必須證明,這種更銳利的在地視覺處理技術,不會在實際行動硬體上引發電池續航、發熱或延遲問題。


