返回首頁

告別口述標點符號!Chrome 151 測試版讓語音輸入學會「聽懂」你的語氣

編輯核心觀點

  • Google 在 Chrome 151 Beta 中引入語音自動標點功能,透過分析說話者的停頓與語調自動補全標點符號。
  • 開發者可透過 Web Speech API 的新屬性啟用此功能,無需自行建立標點模型即可提升網頁應用的語音輸入體驗。
  • 此更新反映 Google 致力於讓 AI 產品更貼近人類自然溝通模式,減少使用者為了遷就機器而改變說話習慣的必要性。
告別口述標點符號!Chrome 151 測試版讓語音輸入學會「聽懂」你的語氣

Google 正低調優化 Chrome 瀏覽器的語音聽寫體驗。在最新的 Chrome 151 Beta 版本中,瀏覽器的語音辨識引擎新增了一項關鍵能力:自動推斷標點符號。這意味著使用者在進行語音輸入時,不再需要刻意唸出「逗號」、「句號」或「問號」等指令,系統能直接根據說話者的語氣與節奏自動補上標點。

從「聽懂字詞」到「聽懂語氣」

過去語音輸入最大的痛點在於,若使用者不逐一唸出標點符號,產出的文字往往缺乏斷句,導致語意破碎。Google 此次透過 Web Speech API 引入了名為 unspokenPunctuation 的布林屬性(boolean attribute),讓語音辨識引擎能根據說話時的停頓(pauses)、語調(intonation)與韻律(prosody),自動判定標點位置。

這項改進對於長篇幅的聽寫任務尤為實用,能避免因頻繁唸出標點指令而中斷說話節奏。這不僅能提升電子郵件、文件撰寫的效率,對於網頁版的轉錄工具、筆記應用、無障礙輔助軟體以及 AI 寫作助理而言,都能帶來更流暢的互動體驗。

開發者受惠,AI 整合趨勢顯現

由於這項功能直接整合於 Chrome 的 Web Speech API,開發者無需自行開發複雜的標點符號模型,即可將此功能導入網頁應用中。Google 指出,這套系統並非單純依賴語音內容,而是透過分析說話者的語氣節奏,讓瀏覽器端的語音辨識更接近人類自然的溝通方式。

此舉也反映了 Google 在旗下軟體生態系的一貫策略。隨著 Gemini 與各類 AI 語言模型深入 Chrome、Android 及 Google Workspace,Google 正將重心從「要求使用者適應機器」轉向「讓機器理解人類的自然對話」。目前 Chrome 151 Beta 已開放開發者進行測試,該功能未來是否普及,將取決於瀏覽器的穩定版發布時程以及開發者對 API 的採用程度。

資料來源

本文由 AI 綜合上述來源編譯整理,內容僅供參考;著作權歸原出處所有。

相關文章