返回首頁

OpenAI 醫療 AI 升級:GPT-5.5 Instant 準確度超越人類醫師

編輯核心觀點

  • OpenAI 推出 GPT-5.5 Instant 模型,在 HealthBench 醫療測試中展現與頂級模型相當的效能,且開放免費版用戶使用。
  • 該模型在準確性、清晰度與完整性上均超越醫師撰寫的回答,錯誤率在過去兩個月內大幅下降 71%。
  • 此成果源自全球 260 多位醫師組成的團隊,針對超過 70 萬則模型回應進行審核與優化。
OpenAI 醫療 AI 升級:GPT-5.5 Instant 準確度超越人類醫師

OpenAI 近期針對 ChatGPT 的醫療應用能力進行重大升級,推出全新的 GPT-5.5 Instant 模型。根據 OpenAI 的說法,該模型在 HealthBench 與 HealthBench Professional 等機器醫療測試中,效能已能與目前市面上最昂貴的「思考型(Thinking)」模型並駕齊驅,但運作成本卻大幅降低。目前,所有 ChatGPT 免費版用戶皆可使用此模型,但仍設有使用次數限制。

醫療表現超越人類醫師

在 OpenAI 的內部基準測試中,GPT-5.5 Instant 在所有五個評估類別的表現均超越了 GPT-4o 以及由醫師撰寫的回答,其中在「指令遵循(instruction following)」指標上,最高得分達到 89.9%。相較於人類醫師的專業建議,GPT-5.5 Instant 在回答的準確性、清晰度與完整性上均取得更高評分,且錯誤醫療陳述的比例在過去兩個月內下降了 71%。

醫師團隊參與模型訓練

這項技術進步背後的關鍵,是一支由全球 60 個國家、超過 260 位醫師組成的專業網絡。這群醫療專家針對超過 70 萬則模型回應進行了審核與校正,確保 AI 輸出的內容符合臨床標準。OpenAI 指出,目前每週有超過 2.3 億人使用 ChatGPT 處理醫療相關問題,包括解讀檢驗報告、準備就醫諮詢,或是釐清保險條款等。

除了針對一般大眾的服務外,OpenAI 也提供專為醫療專業人員設計的工具,如「ChatGPT for Clinicians」與「OpenAI for Healthcare」,持續擴大其在醫療領域的技術佈局。

資料來源

本文由 AI 綜合上述來源編譯整理,內容僅供參考;著作權歸原出處所有。

相關文章