告別AI「代幣最大化」:企業轉向「模型最大化」,精打細算省下天價帳單
編輯核心觀點
- ✦過去企業盲目追求AI「代幣最大化」,導致高昂帳單,現正反思其策略。
- ✦新趨勢「模型最大化」提倡依任務複雜度,智慧選擇成本較低的舊模型或昂貴的尖端模型。
- ✦從工程師到設計師,各領域專業人士正透過模型切換與工作流程調整,有效降低AI使用成本。

2026年上半年,人工智慧(AI)社群中瀰漫著一個關鍵詞:「代幣最大化」(tokenmaxxing)。這個詞彙描述了企業鼓勵員工盡可能廣泛使用AI模型的現象。然而,隨著Uber、微軟等公司審視員工累積的AI帳單,他們開始採取更為審慎的策略。如今,一股新的成本節約風潮正在興起,那就是「模型最大化」(modelmaxxing)。
「模型最大化」的核心理念是:將最困難、需要高度智能的任務分配給價格較高的尖端模型,而將較簡單、重複性的任務交由較舊、成本更低的模型處理。這種精打細算的「代幣衛生」策略,正成為創辦人、軟體工程師、使用者體驗(UX)設計師,甚至是熱衷於「氛圍編碼」(vibe-coding,指非技術人員憑直覺使用AI編碼)的非技術人員,在AI預算緊縮和用量上限實施下,實現更高效益的關鍵。
從盲目追求到智慧選用:AI成本管理的典範轉移
位於太浩湖的AI新創公司Bold Metrics技術長摩根.林頓(Morgan Linton)每週兩次會向他的16位工程師明確指示該使用哪些AI模型以及使用的時機。他會在團隊的例行會議前,告知其中一個團隊使用低階的Claude Fable,另一個團隊則使用高階的GPT-5.5。他透露,第三個團隊使用Cursor搭配Composer 2.5,正獲得「完全完美的結果」。林頓表示,這種針對模型使用的精確性,讓他無需設定嚴格的代幣用量上限。
「我的團隊正在使用最好的工具,但他們的使用效率也更高了。」
當然,使用最新模型有其充分理由。OpenAI的凱琳.沃斯(Kaylin Voss)曾在LinkedIn上指出,更好的模型能「減少重試、監督和浪費的精力」。然而,有些任務根本不值得付出高昂的成本。
Coinbase執行長布萊恩.阿姆斯壯(Brian Armstrong)是首批公開闡述此觀點的人之一。他在6月7日的一則X貼文中寫道:
「未來12到18個月內,80%的工作負載將運行在便宜99%的模型上。」
他補充說,其餘20%的工作負載將繼續運行在最新模型上,因為「智商最大化」(IQ maxxing)在此至關重要。
AI新創公司Hechura的共同創辦人克里斯.馬可尼(Chris Maconi)從來就不是「代幣最大化」的擁護者。他以「人機協作」(human-in-the-loop)的態度經營公司,不設定全天候自動編碼的機器人。模型選擇正是他這種反「代幣最大化」觀點的一部分。馬可尼回憶起OpenClaw的熱潮——這是一種封裝在Mac Mini中的AI代理,由於其24/7的運作和廣泛的自主性,特別消耗代幣。他設置OpenClaw時,從便宜的Gemini模型開始,然後才切換到Anthropic的Haiku。馬可尼說:
「我不害怕嘗試這些低階模型,看看它們是否能提供我們所需的智能。」
創意省代幣:從設計到測試的實戰策略
29歲的大型科技公司使用者體驗設計師坦維.皮薩爾(Tanvi Pisal)表示,她透過慘痛的教訓學會了如何更有效率地使用模型。皮薩爾使用Figma、ChatGPT和Claude等工具來進行腦力激盪和制定產品需求文件。她擁有公司訂閱的ChatGPT,並自費訂閱每月20美元的Claude Pro基本方案。她坦言,一開始她會直接使用Claude從零開始構思使用者體驗,這個過程讓她「浪費了數月的代幣」,卻仍未完成任務。
皮薩爾分享了她的新策略:「所以我現在的做法是,先在Figma中設計好一切,然後將這些螢幕截圖放入Claude。我告訴Claude保持使用者介面不變,並建構完整的功能和流程。這種『設計優先』的流程確實幫助我節省了代幣。」她還選擇使用公司企業方案免費的ChatGPT來進行初步的腦力激盪,然後將精煉後的想法帶到Claude,以創建更精美的文件。
紐約市的軟體工程師兼科技內容創作者亞歷杭德拉.湯瑪斯(Alejandra Thomas)表示,她會對每個新發布的模型進行測試,以了解它們各自的優勢。「我盡量不只因為最昂貴或最先進的模型可用就去使用它。對於簡單的任務,我總是使用較輕量的模型,甚至完全不用。」
AI銷售公司Scoot的執行長艾德.史蒂文斯(Ed Stevens)則喜歡「選一匹馬就騎到底」。他的工程師會選定一個模型,試用幾個月,然後判斷它是否符合要求。如果出現了閃亮的新模型,或者他們認為可以用更低的成本達到同樣的效果,史蒂文斯說,他們就會「換馬」。
稀缺心態與自動化工具:AI成本管理的未來
杜克大學行為經濟學研究員兼教授丹.艾瑞利(Dan Ariely)指出,這種從每個代幣中榨取最大價值的想法,體現了一種「稀缺心態」(scarcity mindset)。艾瑞利認為,代幣預算讓他想起早期的手機,當時通話時間是有限的。他說,人們會在月底試圖用完所有分鐘數,即使這意味著打給他們其實不想打的人。
「代幣創造了一種稀缺模型,人們無法隨心所欲地使用。它設定了一個使用目標,並在人們未能達到目標時,產生一種浪費的心理。」
他補充說,由於用戶不想超出限制並支付額外費用,一旦達到代幣上限,他們就會轉向其他公司的模型以節省開支。
如果這種AI模型切換聽起來令人筋疲力盡,好消息是您無需獨自做出這些決策。專門進行模型路由(model routing)的新創公司正蔚為風潮。這些公司提供軟體,根據任務的複雜性,將任務分配給特定的模型,有時甚至包括開源模型。它們是創投界的寵兒,像OpenRouter這樣的新創公司正獲得大量資金挹注。
大衛.吉爾摩(David Gilmore)經營著其中一家公司Rayline。他的工具會攔截請求,並判斷這些請求是否可以轉發給更便宜、通常是開源的模型。他表示,許多客戶都曾陷入「錯失恐懼症」(FOMO moment),盲目追求最新最貴的模型。如今,透過智慧的模型選擇與管理,企業正逐步擺脫過去的「代幣最大化」迷思,走向更為永續且高效的AI應用之路。



