OpenAI 醫療 AI 升級：GPT-5.5 Instant 準確度超越人類醫師

OpenAI 近期針對 ChatGPT 的醫療應用能力進行重大升級，推出全新的 GPT-5.5 Instant 模型。根據 OpenAI 的說法，該模型在 HealthBench 與 HealthBench Professional 等機器醫療測試中，效能已能與目前市面上最昂貴的「思考型（Thinking）」模型並駕齊驅，但運作成本卻大幅降低。目前，所有 ChatGPT 免費版用戶皆可使用此模型，但仍設有使用次數限制。

醫療表現超越人類醫師

在 OpenAI 的內部基準測試中，GPT-5.5 Instant 在所有五個評估類別的表現均超越了 GPT-4o 以及由醫師撰寫的回答，其中在「指令遵循（instruction following）」指標上，最高得分達到 89.9%。相較於人類醫師的專業建議，GPT-5.5 Instant 在回答的準確性、清晰度與完整性上均取得更高評分，且錯誤醫療陳述的比例在過去兩個月內下降了 71%。

醫師團隊參與模型訓練

這項技術進步背後的關鍵，是一支由全球 60 個國家、超過 260 位醫師組成的專業網絡。這群醫療專家針對超過 70 萬則模型回應進行了審核與校正，確保 AI 輸出的內容符合臨床標準。OpenAI 指出，目前每週有超過 2.3 億人使用 ChatGPT 處理醫療相關問題，包括解讀檢驗報告、準備就醫諮詢，或是釐清保險條款等。

除了針對一般大眾的服務外，OpenAI 也提供專為醫療專業人員設計的工具，如「ChatGPT for Clinicians」與「OpenAI for Healthcare」，持續擴大其在醫療領域的技術佈局。

OpenAI 醫療 AI 升級：GPT-5.5 Instant 準確度超越人類醫師

編輯核心觀點

醫療表現超越人類醫師

醫師團隊參與模型訓練

資料來源

相關文章

OpenAI 疑似秘密測試 GPT-5.6：回應速度變慢、推理能力卻顯著提升

參數僅 3B 卻能挑戰千億級模型！微博團隊發表 VibeThinker-3B，揭開「推理特化」新路徑

AI 發展雙軌並進：Meta 腦機介面解碼突破與 Anthropic Claude 5 效能升級

OpenAI 讓 ChatGPT 成本砍半：AI 推論效率大躍進，產業迎來喘息空間？