不只是聊天機器人!Sakana AI 推「虛擬策略長」Marlin,八小時產出百頁深度研究報告
編輯核心觀點
- ✦Sakana AI 推出企業級自主研究代理 Marlin,透過長達八小時的自主運算,為企業產出包含簡報與參考文獻的完整深度報告。
- ✦其核心技術源自「自適應分支蒙地卡羅樹搜尋(AB-MCTS)」,能根據研究進度自動選擇加深或擴展搜尋路徑,並整合多模型協作以提升準確度。
- ✦Marlin 專為高風險策略決策設計,目前已與三菱日聯金融集團(MUFG)合作,並獲得花旗集團(Citigroup)戰略投資。

主打深度而非速度的企業級研究代理
總部位於東京的 Sakana AI 本週正式推出其首款商業化產品「Sakana Marlin」。與一般在幾秒鐘內回應的聊天機器人不同,Marlin 被定位為「虛擬策略長(Virtual CSO)」,專為企業級自主研究任務而設計。使用者僅需輸入一個研究主題,Marlin 便會自動進行長達約八小時的深度研究,最終產出一份包含數十頁至百頁不等的詳細報告,以及由 AI 生成的配套簡報。
核心技術:AB-MCTS 與多模型協作
Marlin 的運作核心是 Sakana AI 開發的「自適應分支蒙地卡羅樹搜尋(Adaptive Branching Monte Carlo Tree Search, AB-MCTS)」。這項技術將推理過程視為樹狀搜尋問題,在每個步驟中,演算法會根據當前進度決定「變寬(Wider)」——生成新的候選答案,或是「變深(Deeper)」——針對現有具潛力的路徑進行精煉。
此外,Marlin 具備多模型協作能力,能根據任務需求將步驟分配給不同的模型處理。在 Sakana AI 的 ARC-AGI-2 實驗中,結合 o4-mini、Gemini 2.5 Pro 與 DeepSeek-R1 的協作模式,解決了約 27.5% 的任務,優於單獨使用 o4-mini 的 23%。
鎖定高風險決策場景
Marlin 的設計目標是解決企業在策略制定、市場研究、風險分析及競爭對手分析中的瓶頸。例如,它能針對「評估日本穩定幣與代幣化支付市場」或「霍爾木茲海峽封鎖的情境模型」等複雜議題,進行假設測試並提出結構化結論。Sakana AI 於 2026 年 4 月進行了封閉測試,約 300 名專業人士參與,並已與三菱日聯金融集團(MUFG)建立合作關係,同時獲得花旗集團(Citigroup)的戰略投資。
開放核心演算法與收費模式
雖然 Marlin 本身為封閉系統,但 Sakana AI 已將其核心演算法以 Apache 2.0 授權開源為「TreeQuest」,供 AI 研究人員進行開發與測試。在商業定價方面,Marlin 採取按量計費模式,每項任務起價為 100 點(每點 98 日圓),另提供月費制的 Pro 與 Team 方案,企業版則採客製化報價。
重要提醒:儘管 Marlin 能大幅縮短策略研究的時間,但其產出的報告仍可能包含難以察覺的錯誤,因此在進行最終決策前,仍須由人類專家進行審核與驗證。



