Whisper JAX 線上影片語音轉文字 AI 工具,支援 YouTube,使用 Whisper 模型

Whisper 是 OpenAI 推出的開源模型,也是目前最強的語音轉文字 AI 模型,支援超多語言,包括繁體中文,因此對於有語音轉文字需求的人,非常推薦使用 Whisper。而這篇要介紹的 Whisper Jax,就是一款採用 Whisper 的線上工具,支援上傳聲音檔、麥克風、以及 YouTube,雖然是線上工具,但轉換速度也很快,而且精準度非常高,更重要是完全免費。

你可能感興趣:

目錄

Whisper JAX 操作教學

Whisper JAX 特點:

  • 完全免費
  • 使用 OpenAI 開發的 large-v2
  • 轉換速度超快
  • 支援 YouTube、聲音檔上傳、麥克風
  • 可加入時間戳

Whisper Jax 雖然是國外的工具,尚未支援繁體中文語系,但操作很簡單,即使是不太懂英文的人也能快速上手,下面就來一步步告訴你怎麼操作。

1. 選擇你要轉換的語音類型

進到網站之後,上方可選擇你要轉換的語音類型,由左到右分別是「Microphone 麥克風」、「聲音檔 Audio File」、和「YouTube」 :
Whisper JAX

2. 上傳或貼上你要轉換的 YouTube 影片網址

我以 YouTube 為例,把影片網址貼在 YouTube URL 後,按下方的 Submit 就會開始轉換。transcribe 為語音轉文字,translate 則是翻譯,不過翻譯需要填入自己的 OpenAI API,因此單純語音轉文字的話,選 transcribe 就好。如果你想要每段文字前方都會加上時間點,請將 Return timestamps 打勾:
Whisper 語音轉文字 YouTube 操作教學

3. 完成後,可將所有文字一鍵複製

轉換速度相當快,右下 Transcription 就是轉成文字後的結果,我先測試英文影片,不到 10 秒就完成 15 分鐘的影片,真的強。右上角方塊圖示就是一鍵複製:
英文 YouTube 語音轉文字

再來我測試小 Lin 說的影片,這部是簡體中文,它也會自動判斷成字幕是要輸出成簡體中文:
簡體中文 YouTube 語音轉文字

而我測試風傳媒的影片,也成功轉成繁體中文字幕:
繁體中文 YouTube 語音轉文字

Whisper JAX 使用上有什麼需注意的嗎?

如果你是要靠它產生影片的字幕檔,有一點要注意是,它產生出的時間格式不符合字幕檔,就以下面這段為例,這是 Whisper JAX 產生的某一段語音轉文字:

[02:48.960 -> 02:50.000] 所以我們現在

注意前面的時間格式,有很多不符合字幕檔的要求

  • .960 應該是要 ,960 才對,也就是點點變成逗點,
  • 箭頭部分要 –>,而不是 ->
  • 時間前後也不需要 []

所以說,如果你直接一鍵複製 Whisper JAX 轉好的內容,然後製作成 SRT 字幕檔,你會發現字幕出不來,就是以上這幾個原因。

只能手動調整來解決這個問題,所以製作字幕檔不太推薦用這線上工具。

另外,如果你是上聲音檔,太重要的檔案也不太建議,畢竟是要上傳到網站伺服器,多少還是有安全性上的顧慮。

Whisper JAX 是完全免費的嗎?

是的,完全免費且沒有任何限制,你要轉換多少聲音檔、YouTube 影片都可以。長度也是,多常都沒問題。

Whisper JAX 需要填寫 API 嗎?使用什麼模型?

不需要,打開網站就能直接開始使用,無需填寫任何資料、API,連註冊都不用。

使用的模型是 Whisper large-v2,雖然不是目前最新的 large-v3,但 large-v2 已經可以滿足絕大多數需求,準確度也相當高。

總結

這款線上工具無疑是目前最強語音轉文字之一,我測試好幾部影片都完美轉換,速度也快,對於有相關需求的人,相當推薦使用。

Picture of Rocky

Rocky

曾任職於各大科技網站編輯,目前也是電腦王阿達資深編輯,接觸科技已經長達 10 年,熱愛將一些新科技、知識、和經驗分享給所有人。目前居住在日本,老婆是日本人,偶爾也會分享一些日本生活內容。

全部文章