
MiniMax Audio 是中國新創公司 MiniMax 推出的 AI 語音生成平台,核心技術是基於 Transformer 模型,並透過創新的可學習說話的人編碼器,使其能夠在「零樣本」的情況下,生成與參考音色高度一致且富有情感的語音。
不只是單純的文字轉語音,還提供聲音複製、語音修復等多種功能,為使用者提供全方位的音訊解決方案。
生成的語音品質極度逼真,在許多情況下,很難分辨是真人還是 AI,語氣、情感,甚至是笑聲等細微之處,都精準捕捉與還原,這也為內容創作者、開發者和企業用戶,提供極大的便利性與創作性。
MiniMax Audio 主要功能
- 高品質文字轉語音:支援超過 300 種語音選項及多種語言,並可將長達 20 萬字元的文字,轉換為自然流暢的語音,也能精細調整語音的速度、音高、音量,甚至注入快樂、悲傷、憤怒等多種情感。
- 高準確度語音克隆:只需要 10 秒的清晰音訊樣本,即可複製出與原聲相似度高達 99% 的 AI 語音。
- 語音分離器:能智慧的從音訊中分離人聲,有效去除背景噪音或音樂,讓錄音品質更加清晰、專業。
- 開發者 API:提供 API 接口,開發人員可將 MiniMax Audio 強大的語音生成功能整合到自己的應用程式或服務中。
MiniMax Audio 是免費的嗎
是的,MiniMax Audio 可免費使用,註冊後會獲得 10,000 點,可用於生成音訊。
如果需要更多點數和使用所有功能、商業用途,可以考慮升級付費版,價格不貴,有 Starter、Creator、Standard、Pro、以及 Top-up Credits,每月 4 美元起。
MiniMax Audio 支援哪些平台
MiniMax Audio 目前只有提供網頁版,透過任何瀏覽器都能使用,手機和電腦板都是,還沒有消息指出官方是否會推出行動版 App。MiniMax Audio 使用技巧
- 在輸入的文字中適當加入停頓的標示,可以讓 AI 生成的語音聽起來更像真人說話節奏,更具備自然感。
- 進行語音克隆時,請確保上傳或錄製的 10 秒樣本是在安靜、無背景噪音的環境下完成,這將大幅提升複製聲音的準確度與清晰度。
- 嘗試不同的情感選項(如快樂、悲傷)並微調音高和速度,可以讓內容更具感染力。
- 對於內容創作者來說,可利用此工具快速生成影片旁白、Podcast 或有聲書,大幅節省錄音和後製的時間與成本。
MiniMax Audio 支援的語言有哪些
MiniMax Audio 目前操作介面只有英文,不過轉語音部分就支援多國語言,超過 30 種,包括中文,並提供各種方言選擇。
MiniMax Audio 缺點
- 免費版限制:免費方案提供的點數有限,對於需要大量生成音訊的用戶來說,會需要考慮付費版。
- 進階功能需付費:部分進階功能、更高的音訊品質或商業用途,需要升級到付費方案才能使用。
- 操作介面不支援中文:雖然是中國公司推出的服務,但卻沒有加入中文介面,這有點奇怪,對英文不好的使用者會需要花點時間熟悉。
- 學習曲線:雖然基本操作簡單,但要完全掌握其所有進階功能,並創造出最理想的音訊效果,會需要投入一定的時間學習和實驗。

Rocky
曾任職於各大科技網站編輯,目前也是電腦王阿達資深編輯,接觸科技已經長達 10 年,熱愛將一些新科技、知識、和經驗分享給所有人。目前居住在日本,老婆是日本人,偶爾也會分享一些日本生活內容。