AI 陷入「集體平庸」？新創開發 Flint 模型打破大型語言模型的思考同溫層

AI 模型的集體平庸現象

當你要求 ChatGPT、Claude 或 Gemini 隨機給出一個 1 到 10 之間的數字，絕大多數情況下你會得到「7」。如果接著要求「再來一個」，你會得到「3」或「4」。這種高度的可預測性，揭示了大型語言模型（LLM）正陷入一種「集體平庸」的困境。對於程式編寫或資料研究等任務，這種穩定性是優點，但若用於腦力激盪或規劃行程，這種同質化便成了阻礙。

澳洲新創公司 Springboards 的共同創辦人兼執行長 Pip Bingemann 指出，主流模型為了追求回答的可靠度，往往會收斂至機率最高的「安全」答案。為了打破這種限制，他們開發了名為 Flint 的模型，專門訓練以產生更多樣化的回應。

Flint 如何跳脫框架？

Flint 基於阿里巴巴開源的 Qwen 3 模型構建。Springboards 的共同創辦人兼技術長 Kieran Browne 解釋，他們曾嘗試調整模型常見的「溫度（temperature）」參數來增加隨機性，但這往往會導致模型輸出變得支離破碎，甚至在句子中途混入程式碼。因此，他們採取了更精細的做法：Flint 被訓練去識別輸出中哪些關鍵點適合加入變化，僅在這些特定位置注入隨機性，而非全面提高隨機度。

行銷公司 Uncommon 的共同創辦人兼首席策略長 Maximilian Weigl 表示，他的團隊會將 Flint 與主流模型搭配使用。他認為：「你無法用那些只會把你拉回平均值的工具，創造出突破邊界的內容。」

創意產業的實驗性應用

目前，Springboards 提供一套整合多種 LLM 的工具，讓廣告與行銷專業人士在腦力激盪時，能自由組合不同模型的輸出。Bodacious 創辦人 Zoe Scaman 在測試中發現，Flint 能提供完全不同的思考路徑。例如在處理「如何為年輕人重塑金融公司」的案例時，主流模型皆給出「以有趣方式教導金融知識」等老生常談的建議，而 Flint 則提出「重塑財富積累概念」的獨特觀點。

不過，Scaman 也坦言 Flint 目前仍是原型產品，有時會因為過度追求創意而表現不穩。OpenAI 則對此回應，訓練模型提供可靠且連貫的回答，確實會導致其收斂至熟悉的機率性回應，而過度追求新穎性則可能導致回答品質下降或不可靠。

這項關於 AI 同質性的問題已引起學界關注。在 NeurIPS 大會獲獎的論文《Artificial Hivemind: The Open-Ended Homogeneity of Language Models (and Beyond)》中，研究人員測試了 25 種模型，發現當被要求描述「時間」的隱喻時，絕大多數模型都給出了「時間是河流」或「時間是織布工」等高度雷同的答案。

AI 陷入「集體平庸」？新創開發 Flint 模型打破大型語言模型的思考同溫層

編輯核心觀點

AI 模型的集體平庸現象

Flint 如何跳脫框架？

創意產業的實驗性應用

資料來源

相關文章

AI 進化論新篇章：MIT 發表 SEAL 架構，讓語言模型學會「自我編輯」與參數更新

Meta 腦機介面新突破：Brain2Qwerty v2 挑戰侵入式植入物，AI 轉譯大腦訊號更精準

參數僅 3B 卻能挑戰千億級模型！微博團隊發表 VibeThinker-3B，揭開「推理特化」新路徑

搜尋引擎過時了？「In the Weights」用 AI 模型權重，量化你在超智慧眼中的存在感