使用 HTML5 Web Speech Recognition API 時獲得更好的辨識結果。
1. 確保語音輸入品質
麥克風品質
- 使用品質較佳的麥克風,並盡量靠近嘴巴。
- 低噪音的環境有助於提升辨識率。
降低背景雜音
- 若環境嘈雜,考慮使用降噪麥克風或在安靜的空間進行測試。
- 關閉或遠離其他聲音來源(例如音樂、電視、風扇等)。
語速與咬字清晰度
- 放慢語速、咬字清晰,可以幫助系統更準確地辨識語音。
2. 正確設定語言與參數
設定語言 (lang)
- 例如在繁體中文環境,請將
recognition.lang設為"zh-TW",以確保系統使用繁體中文模型。 - 如果要使用其他語言或口音,請設定對應的語言代碼(如
"en-US"、"zh-CN"等)。
- 例如在繁體中文環境,請將
啟用 interimResults
- 將
recognition.interimResults = true;可以在使用者說話的同時,顯示暫時辨識結果,有助於即時回饋,也能更早發現辨識錯誤並重新輸入。
- 將
調整 continuous
recognition.continuous = true;可以在一次啟動後持續接收語音,直到手動停止或用戶靜音一段時間,對於較長的輸入可能有幫助。
使用 maxAlternatives
- 可設定
recognition.maxAlternatives = 3;(預設 1)取得多個辨識候選,方便在前端做比對或後處理,以選出最適合的結果。
- 可設定
3. 使用語法 (Grammar) 強化辨識 (實驗性)
HTML5 Web Speech API 支援使用 JSGF 語法 (Java Speech Grammar Format) 來協助系統鎖定特定詞彙或句型,進而提升辨識率。不過目前各瀏覽器對此支援度不一,Chrome 尚屬實驗性功能,實際效果視瀏覽器與版本而定。
以下是一個簡單的示例: