AI 陷入「集體平庸」?新創開發 Flint 模型打破大型語言模型的思考同溫層
編輯核心觀點
- ✦主流大型語言模型因訓練數據與任務相似,導致回答高度趨同,缺乏創意與多樣性。
- ✦澳洲新創 Springboards 開發出 Flint 模型,透過針對性調整隨機性參數,為創意工作者提供更具變化的輸出。
- ✦專家指出,雖然 Flint 在腦力激盪時能提供獨特觀點,但目前仍處於原型階段,且主流模型傾向保守是為了維持回答的可靠度。

AI 模型的集體平庸現象
當你要求 ChatGPT、Claude 或 Gemini 隨機給出一個 1 到 10 之間的數字,絕大多數情況下你會得到「7」。如果接著要求「再來一個」,你會得到「3」或「4」。這種高度的可預測性,揭示了大型語言模型(LLM)正陷入一種「集體平庸」的困境。對於程式編寫或資料研究等任務,這種穩定性是優點,但若用於腦力激盪或規劃行程,這種同質化便成了阻礙。
澳洲新創公司 Springboards 的共同創辦人兼執行長 Pip Bingemann 指出,主流模型為了追求回答的可靠度,往往會收斂至機率最高的「安全」答案。為了打破這種限制,他們開發了名為 Flint 的模型,專門訓練以產生更多樣化的回應。
Flint 如何跳脫框架?
Flint 基於阿里巴巴開源的 Qwen 3 模型構建。Springboards 的共同創辦人兼技術長 Kieran Browne 解釋,他們曾嘗試調整模型常見的「溫度(temperature)」參數來增加隨機性,但這往往會導致模型輸出變得支離破碎,甚至在句子中途混入程式碼。因此,他們採取了更精細的做法:Flint 被訓練去識別輸出中哪些關鍵點適合加入變化,僅在這些特定位置注入隨機性,而非全面提高隨機度。
行銷公司 Uncommon 的共同創辦人兼首席策略長 Maximilian Weigl 表示,他的團隊會將 Flint 與主流模型搭配使用。他認為:「你無法用那些只會把你拉回平均值的工具,創造出突破邊界的內容。」
創意產業的實驗性應用
目前,Springboards 提供一套整合多種 LLM 的工具,讓廣告與行銷專業人士在腦力激盪時,能自由組合不同模型的輸出。Bodacious 創辦人 Zoe Scaman 在測試中發現,Flint 能提供完全不同的思考路徑。例如在處理「如何為年輕人重塑金融公司」的案例時,主流模型皆給出「以有趣方式教導金融知識」等老生常談的建議,而 Flint 則提出「重塑財富積累概念」的獨特觀點。
不過,Scaman 也坦言 Flint 目前仍是原型產品,有時會因為過度追求創意而表現不穩。OpenAI 則對此回應,訓練模型提供可靠且連貫的回答,確實會導致其收斂至熟悉的機率性回應,而過度追求新穎性則可能導致回答品質下降或不可靠。
這項關於 AI 同質性的問題已引起學界關注。在 NeurIPS 大會獲獎的論文《Artificial Hivemind: The Open-Ended Homogeneity of Language Models (and Beyond)》中,研究人員測試了 25 種模型,發現當被要求描述「時間」的隱喻時,絕大多數模型都給出了「時間是河流」或「時間是織布工」等高度雷同的答案。


