告別口述標點符號！Chrome 151 測試版讓語音輸入學會「聽懂」你的語氣

Google 正低調優化 Chrome 瀏覽器的語音聽寫體驗。在最新的 Chrome 151 Beta 版本中，瀏覽器的語音辨識引擎新增了一項關鍵能力：自動推斷標點符號。這意味著使用者在進行語音輸入時，不再需要刻意唸出「逗號」、「句號」或「問號」等指令，系統能直接根據說話者的語氣與節奏自動補上標點。

從「聽懂字詞」到「聽懂語氣」

過去語音輸入最大的痛點在於，若使用者不逐一唸出標點符號，產出的文字往往缺乏斷句，導致語意破碎。Google 此次透過 Web Speech API 引入了名為 unspokenPunctuation 的布林屬性（boolean attribute），讓語音辨識引擎能根據說話時的停頓（pauses）、語調（intonation）與韻律（prosody），自動判定標點位置。

這項改進對於長篇幅的聽寫任務尤為實用，能避免因頻繁唸出標點指令而中斷說話節奏。這不僅能提升電子郵件、文件撰寫的效率，對於網頁版的轉錄工具、筆記應用、無障礙輔助軟體以及 AI 寫作助理而言，都能帶來更流暢的互動體驗。

開發者受惠，AI 整合趨勢顯現

由於這項功能直接整合於 Chrome 的 Web Speech API，開發者無需自行開發複雜的標點符號模型，即可將此功能導入網頁應用中。Google 指出，這套系統並非單純依賴語音內容，而是透過分析說話者的語氣節奏，讓瀏覽器端的語音辨識更接近人類自然的溝通方式。

此舉也反映了 Google 在旗下軟體生態系的一貫策略。隨著 Gemini 與各類 AI 語言模型深入 Chrome、Android 及 Google Workspace，Google 正將重心從「要求使用者適應機器」轉向「讓機器理解人類的自然對話」。目前 Chrome 151 Beta 已開放開發者進行測試，該功能未來是否普及，將取決於瀏覽器的穩定版發布時程以及開發者對 API 的採用程度。

告別口述標點符號！Chrome 151 測試版讓語音輸入學會「聽懂」你的語氣

編輯核心觀點

從「聽懂字詞」到「聽懂語氣」

開發者受惠，AI 整合趨勢顯現

資料來源

相關文章

WebBrain 開源 AI 瀏覽器代理：支援本地運行、自動化操作，隱私與功能兼顧

亞馬遜自研晶片策略轉向：推動 Alexa Plus 走向邊緣運算，預告穿戴式 AI 裝置藍圖

OpenAI 擬讓美國政府持股 5%：Sam Altman 提議建立 AI 版「阿拉斯加永久基金」

Brave 瀏覽器正式導入「容器」功能：告別多帳號切換的繁瑣，Chromium 用戶終於等到