- 發表日期:
Whisper 是 OpenAI 推出的開源模型,也是目前最強的語音轉文字 AI 模型,支援超多語言,包括繁體中文,因此對於有語音轉文字需求的人,非常推薦使用 Whisper。而這篇要介紹的 Whisper Jax,就是一款採用 Whisper 的線上工具,支援上傳聲音檔、麥克風、以及 YouTube,雖然是線上工具,但轉換速度也很快,而且精準度非常高,更重要是完全免費。
你可能感興趣:
目錄
Whisper JAX 操作教學
Whisper JAX 特點:
- 完全免費
- 使用 OpenAI 開發的 large-v2
- 轉換速度超快
- 支援 YouTube、聲音檔上傳、麥克風
- 可加入時間戳
Whisper Jax 雖然是國外的工具,尚未支援繁體中文語系,但操作很簡單,即使是不太懂英文的人也能快速上手,下面就來一步步告訴你怎麼操作。
1. 選擇你要轉換的語音類型
進到網站之後,上方可選擇你要轉換的語音類型,由左到右分別是「Microphone 麥克風」、「聲音檔 Audio File」、和「YouTube」 :
2. 上傳或貼上你要轉換的 YouTube 影片網址
我以 YouTube 為例,把影片網址貼在 YouTube URL 後,按下方的 Submit 就會開始轉換。transcribe 為語音轉文字,translate 則是翻譯,不過翻譯需要填入自己的 OpenAI API,因此單純語音轉文字的話,選 transcribe 就好。如果你想要每段文字前方都會加上時間點,請將 Return timestamps 打勾:
3. 完成後,可將所有文字一鍵複製
轉換速度相當快,右下 Transcription 就是轉成文字後的結果,我先測試英文影片,不到 10 秒就完成 15 分鐘的影片,真的強。右上角方塊圖示就是一鍵複製:
再來我測試小 Lin 說的影片,這部是簡體中文,它也會自動判斷成字幕是要輸出成簡體中文:
而我測試風傳媒的影片,也成功轉成繁體中文字幕:
Whisper JAX 使用上有什麼需注意的嗎?
如果你是要靠它產生影片的字幕檔,有一點要注意是,它產生出的時間格式不符合字幕檔,就以下面這段為例,這是 Whisper JAX 產生的某一段語音轉文字:
[02:48.960 -> 02:50.000] 所以我們現在
注意前面的時間格式,有很多不符合字幕檔的要求
- .960 應該是要 ,960 才對,也就是點點變成逗點,
- 箭頭部分要 –>,而不是 ->
- 時間前後也不需要 []
所以說,如果你直接一鍵複製 Whisper JAX 轉好的內容,然後製作成 SRT 字幕檔,你會發現字幕出不來,就是以上這幾個原因。
只能手動調整來解決這個問題,所以製作字幕檔不太推薦用這線上工具。
另外,如果你是上聲音檔,太重要的檔案也不太建議,畢竟是要上傳到網站伺服器,多少還是有安全性上的顧慮。
Whisper JAX 是完全免費的嗎?
是的,完全免費且沒有任何限制,你要轉換多少聲音檔、YouTube 影片都可以。長度也是,多常都沒問題。
Whisper JAX 需要填寫 API 嗎?使用什麼模型?
不需要,打開網站就能直接開始使用,無需填寫任何資料、API,連註冊都不用。
使用的模型是 Whisper large-v2,雖然不是目前最新的 large-v3,但 large-v2 已經可以滿足絕大多數需求,準確度也相當高。
總結
這款線上工具無疑是目前最強語音轉文字之一,我測試好幾部影片都完美轉換,速度也快,對於有相關需求的人,相當推薦使用。
Rocky
曾任職於各大科技網站編輯,目前也是電腦王阿達資深編輯,接觸科技已經長達 10 年,熱愛將一些新科技、知識、和經驗分享給所有人。目前居住在日本,老婆是日本人,偶爾也會分享一些日本生活內容。