印度 AI 突圍戰：Avataar 推「Varya」模型，以 1/20 成本搶攻在地化影音市場

印度在 AI 模型開發進度上長期落後於美國、歐洲與中國，市場多數產出集中在大型語言模型或語音模型。為了扭轉現況，印度政府啟動了規模約 12 億美元的「印度 AI 使命（India AI Mission）」，透過補貼 GPU 運算資源，換取獲選新創公開其開發成果。獲選的 12 家新創之一、由 Peak XV 支持的 Avataar AI，近期便推出了專為印度市場打造的影音生成模型「Varya」。

技術突破：模型蒸餾實現成本與速度雙贏

Varya 並非從零建構，而是基於阿里巴巴開源的 Wan 2.2 模型進行「蒸餾（distillation）」優化。Avataar AI 將原始模型的複雜能力壓縮，使其運算步驟從 50 步縮減至 4 步。根據測試，在 NVIDIA H200 GPU 上，Varya 生成 5 秒長的 720p 影片僅需 45 秒，而原始的 Wan 2.2 則需耗時 1,230 秒，速度提升達 10 倍。

成本更是 Varya 的核心競爭力。Avataar 規劃的服務定價為每秒影片 0.48 盧比（約 0.005 美元），相較於 Veo、Kling、Luma 或 Runway 等主流模型每秒 0.10 美元以上的價格，成本降低了約 20 倍。

印度是一個「影音優先」的市場。我們觀察到，在印度所有大型消費性網路產品中，影音的表現皆優於文字。目前的 AI 影音模型對於印度的人口規模應用來說太昂貴了。若要讓影音 AI 普及至學生、教師、微型企業、創作者與公共服務領域，成本必須大幅下降。成本是印度 AI 普及化的最大關鍵。—— Peak XV 董事總經理 Rajan Anandan

在地化數據訓練與開源策略

針對市面上生成式 AI 常見的文化偏見或刻板印象，Avataar AI 強調 Varya 透過精選數據集進行訓練，能更精準地識別印度的文化細節，包括當地的飲食、服飾、建築風格與節慶活動。

Varya 將以開源權重模型（open-weight model）的形式，發布於印度政府的 AI Kosh 入口網站，並同步公開訓練數據，開發者可自行託管或根據需求進行修改。Avataar 同時計畫將該模型整合至企業級服務，並對 Higgsfield 與 Adobe Firefly 等影音工具的合作持開放態度。

印度 AI 的務實路徑

Varya 的問世反映了印度在 AI 領域的務實策略。由於算力資源受限及高品質數據取得不易，業界普遍認為印度應專注於開發應用層與建立強健的開發者生態，而非與全球巨頭競逐基礎模型。印度 IT 部長 Ashwini Vaishnaw 先前曾表示，印度目標在 2028 年前吸引 2,000 億美元的 AI 投資，並計畫在六個月內將 GPU 處理能力提升一倍以上。

印度 AI 突圍戰：Avataar 推「Varya」模型，以 1/20 成本搶攻在地化影音市場

編輯核心觀點

技術突破：模型蒸餾實現成本與速度雙贏

在地化數據訓練與開源策略

印度 AI 的務實路徑

資料來源

相關文章

印度 AI 策略轉向：Avataar 推出的 Varya 模型，如何用 1/27 的成本搶攻在地市場？

貝佐斯的新賭注：Prometheus 募資 120 億美元，目標打造「人工通用工程師」

繞過晶片禁令的戰略佈局：中國成立首座光子計算實驗室，押注「光速」突破算力瓶頸

Meta 啟動公益計畫：免費提供 AI 智慧眼鏡，助美國盲人退伍軍人重拾獨立生活