返回首頁

OpenAI 讓 ChatGPT 成本砍半:AI 推論效率大躍進,產業迎來喘息空間?

編輯核心觀點

  • OpenAI 據報已成功將其 AI 模型推論成本降低超過一半,特別針對未登入的 ChatGPT 訪客用戶。
  • 這項優化讓服務訪客用戶所需的 Nvidia GPU 數量降至數百個,但其技術細節與對完整產品的影響仍待釐清。
  • 同時,Deepseek 也推出開源新方法,能將推論請求速度提升 60% 至 85%,預期這些效率提升將為 AI 實驗室爭取更多發展空間,而非直接減少晶片需求。
OpenAI 讓 ChatGPT 成本砍半:AI 推論效率大躍進,產業迎來喘息空間?

人工智慧(AI)領域的成本效益,一直是各家業者競逐的關鍵。根據《The Information》引述知情人士報導,AI 巨擘 OpenAI 的工程師本月初向同事透露,他們已成功將現有 AI 模型運行的「推論成本」(inference costs)降低逾一半,這項顯著的成本優化首先應用於未登入的 ChatGPT 訪客用戶。

這項新優化措施,讓 OpenAI 服務這些訪客用戶所需的 Nvidia GPU 數量,從原先未知的水準,大幅降至「僅數百個」。儘管確切的技術細節與優化前所需的 GPU 數量仍未公開,但這無疑是一項重大的效率突破。然而,由於訪客用戶只能使用 ChatGPT 非常有限的功能,這些成本效益是否能延伸至完整版產品,目前仍是個未知數。

與此同時,另一家 AI 公司 Deepseek 也發表了一項新的開源方法,能將 AI 推論請求的速度提升 60% 至 85%。這項技術的問世,意味著更多的運算資源將被釋放出來,可用於擴展服務規模、開發更優異的模型、提供更快的反應速度,或是直接提升利潤空間。

綜合來看,這些在 AI 推論效率上的突破,對於整個產業而言具有深遠意義。由於目前資料中心的建置速度相對緩慢,這些效率上的提升,預計將為各 AI 實驗室爭取到更多的「喘息空間」,使其能在現有硬體資源下,更有效地進行模型開發與服務擴展。換句話說,短期內這些進展可能不會直接衝擊到晶片需求,反而讓業者能更從容地應對日益增長的運算負載。

這波 AI 推論成本與速度的優化,不僅展現了 AI 技術在軟體層面的巨大潛力,也為未來 AI 服務的普及化與商業模式的創新,奠定了更堅實的基礎。在硬體供應仍是瓶頸的當下,軟體層面的效率提升,無疑是推動 AI 發展的關鍵驅動力。

資料來源

本文由 AI 綜合上述來源編譯整理,內容僅供參考;著作權歸原出處所有。

相關文章