印度 AI 突圍戰:Avataar 推「Varya」模型,以 1/20 成本搶攻在地化影音市場
編輯核心觀點
- ✦Avataar AI 利用模型蒸餾技術,將阿里巴巴 Wan 2.2 模型壓縮,使影音生成速度提升 10 倍且大幅降低運算成本。
- ✦Varya 模型專為印度市場設計,透過精選數據訓練,能精準辨識印度特有的節慶、飲食與服飾等文化細節。
- ✦此計畫為印度政府 12 億美元「印度 AI 使命」的一部分,旨在透過補貼 GPU 運算資源,推動在地化 AI 應用生態系的發展。

印度在 AI 模型開發進度上長期落後於美國、歐洲與中國,市場多數產出集中在大型語言模型或語音模型。為了扭轉現況,印度政府啟動了規模約 12 億美元的「印度 AI 使命(India AI Mission)」,透過補貼 GPU 運算資源,換取獲選新創公開其開發成果。獲選的 12 家新創之一、由 Peak XV 支持的 Avataar AI,近期便推出了專為印度市場打造的影音生成模型「Varya」。
技術突破:模型蒸餾實現成本與速度雙贏
Varya 並非從零建構,而是基於阿里巴巴開源的 Wan 2.2 模型進行「蒸餾(distillation)」優化。Avataar AI 將原始模型的複雜能力壓縮,使其運算步驟從 50 步縮減至 4 步。根據測試,在 NVIDIA H200 GPU 上,Varya 生成 5 秒長的 720p 影片僅需 45 秒,而原始的 Wan 2.2 則需耗時 1,230 秒,速度提升達 10 倍。
成本更是 Varya 的核心競爭力。Avataar 規劃的服務定價為每秒影片 0.48 盧比(約 0.005 美元),相較於 Veo、Kling、Luma 或 Runway 等主流模型每秒 0.10 美元以上的價格,成本降低了約 20 倍。
印度是一個「影音優先」的市場。我們觀察到,在印度所有大型消費性網路產品中,影音的表現皆優於文字。目前的 AI 影音模型對於印度的人口規模應用來說太昂貴了。若要讓影音 AI 普及至學生、教師、微型企業、創作者與公共服務領域,成本必須大幅下降。成本是印度 AI 普及化的最大關鍵。—— Peak XV 董事總經理 Rajan Anandan
在地化數據訓練與開源策略
針對市面上生成式 AI 常見的文化偏見或刻板印象,Avataar AI 強調 Varya 透過精選數據集進行訓練,能更精準地識別印度的文化細節,包括當地的飲食、服飾、建築風格與節慶活動。
Varya 將以開源權重模型(open-weight model)的形式,發布於印度政府的 AI Kosh 入口網站,並同步公開訓練數據,開發者可自行託管或根據需求進行修改。Avataar 同時計畫將該模型整合至企業級服務,並對 Higgsfield 與 Adobe Firefly 等影音工具的合作持開放態度。
印度 AI 的務實路徑
Varya 的問世反映了印度在 AI 領域的務實策略。由於算力資源受限及高品質數據取得不易,業界普遍認為印度應專注於開發應用層與建立強健的開發者生態,而非與全球巨頭競逐基礎模型。印度 IT 部長 Ashwini Vaishnaw 先前曾表示,印度目標在 2028 年前吸引 2,000 億美元的 AI 投資,並計畫在六個月內將 GPU 處理能力提升一倍以上。



