iMyFone VoxBox – TTS 文字轉語音的配音專家

ChatGPT 的問世帶動整個 AI 技術如雨後春筍般大量冒出,AI 產業也從以文字為主,慢慢演進到圖片、聲音,甚至是影片生成。今天小蛙要來測試 TTS 文字轉語音的配音專家 – iMyFone VoxBox 這套軟體,看看 VoxBox 對於聲音處理方面的功力有多深厚。

iMyFone VoxBox 簡介

iMyFone VoxBox - TTS 文字轉語音的配音專家 - 1

iMyFone 成立於 2015 年,致力於為 iOS、Android 裝置、Windows PC 和 Mac 提供問題的解決方案,工具涵蓋領域包含資料救援、解鎖修復、轉移清理以及其他實用工具,例如今天小蛙要分享的 VoxBox。截至 2022 年,iMyFone 就已經有超過 200 個國家、300 萬個用戶以及 3200 萬次下載。

VoxBox 是 iMyFone 針對聲音處理推出的一條龍工具,支援 100 種以上語言 與 3200 多種聲音,VoxBox 可生成逼真流暢的 AI 聲音,更包含了小蛙最常用的文本轉語音 (TTS: Text to Speech)、語音轉文字 (STT: Speech to Text),此外 VoxBox 透過 AI 模仿聲音,無論是對聲音進行複製、轉換、錄音和編輯,皆可輕鬆完成。

VoxBox 文字轉語音

開啟 iMyFone VoxBox 後,左側為 VoxBox 的六大功能清單,切換至文字轉語音,介面中間為欲轉語音的文本,右側可以選擇不同的聲音,下方也有對聲音做細部調整的設定,例如:穩定性、相似度、誇張度、停頓 … 等。點擊「轉換」之後稍作等待,轉換完成的結果會出現在畫面最下方。

iMyFone VoxBox - TTS 文字轉語音的配音專家 - 2

點擊上圖右側的「改變聲音」可以看到有非常多種聲音可供選擇,下圖可見連美國總統拜登都有,還有珍妮佛安妮斯頓,以及「你攻擊了我的村莊」的珍妮佛羅培茲 XD,根據 iMyFone 官方說明,總共有超過 3,200 種聲音,可透過上方搜尋或是快速標籤過濾名人、動畫、電影電視 … 等知名人聲。

iMyFone VoxBox - TTS 文字轉語音的配音專家 - 3

小蛙最新發布的 YouTube Shorts 選擇使用珍妮佛安妮斯頓來幫忙配音,小蛙第一次產出聲音的時候發現珍妮佛安妮斯頓有些句子說話速度太快了,這種情況可以透過右側設定進行微調,將游標移至希望停頓的地方,點擊停頓後選擇 0.25 秒 ~ 3 秒 的停頓時間,設定完成點擊「轉換」按鈕,等待片刻下方就會出現文字轉語音真人的聲音檔囉!

iMyFone VoxBox - TTS 文字轉語音的配音專家 - 4

如果覺得自己寫的腳本不夠吸引人,可以透過「AI 文本助手」進行文字潤飾,AI 文本助手還能協助改寫風格、套用場景模板,若寫腳本時遇到瓶頸,VoxBox 更提供故事生成器幫您產生一個現成的故事

iMyFone VoxBox - TTS 文字轉語音的配音專家 - 5

請大明星珍妮佛安妮斯頓配音的成果影片在這邊~

關於 VoxBox AI 文字轉語音真人更詳細的教學可參考以下影片:

VoxBox 語音轉文字

看完 VoxBox 文字轉語音,接著來試試語音轉文字,左側選單切換到「語音轉文字」,語言部份選擇「Mandarin (Taiwan)」並勾選標點,接著上傳聲音或影片檔案,小蛙使用之前發布在 YouTube 的影片測試,點擊「轉換」

iMyFone VoxBox - TTS 文字轉語音的配音專家 - 6

結果如下:

大家好,我是小這邊用短短的時間提醒大家過年初一任注意事項,一今年可直接在APP上預約目前已開放春節期間1日以上預約春節計費定價計算費用如畫面2扣30趴租金取消預約將依比例退還不退,還珠禁飛春節租車也加入了玉蔻的機制,不要像小一樣收到刷卡通知,還以為被盜刷提前24小時還車將收取提前還車罰金春節租車無法折抵時數5除用安心服務開車較安心,花少少錢買保障六,有長途駕車換人的需求,請務必申請共同承租人避免發生狀況使遇到安心服務,不認列的狀況,七發揮公德心做個有水準有格調的共享車承租人吧,請做好防疫工作避免到人多的地方保護好自己,希望疫情快點結束,我是小

紅色文字是辨識錯誤部分,扣除掉「小蛙」轉成「小花」或「小娃」、以及「iRent」轉成「任」之外,可以看到錄音檔轉文字的辨識正確率還不錯,產生出文本之後,再對不通順或有錯誤的地方進行修正,可大幅減少語音轉文字的人工聽打作業時間。VoxBox 語音轉文字比較可惜的是影片或聲音檔最高只限 1 分鐘,而小蛙大部分影片都超過 1 分鐘,再來是雖然勾選了標點符號,有些句子仍過長,斷句方面還有進步空間。

VoxBox 音檔變聲

前面提到的 2 個功能都是文字及聲音之間的轉換,接下來這個音檔變聲可將使用者選擇的聲音轉換成指定聲音。

左側選擇「音檔變聲」,右側可以看見許多名人的聲音,包括前美國總統川普、現任美國總統拜登、緋紅女巫伊莉莎白歐森、安海瑟薇、伊隆馬斯克、李奧納多迪卡皮歐 … 等,將要轉換的音檔拖曳到軟體後,點擊右下角的轉換,稍待片刻即可將選擇的音檔轉換成選取名人的聲音,非常有趣~

iMyFone VoxBox - TTS 文字轉語音的配音專家 - 7

VoxBox 音效增強

小蛙之前發過一篇對於圖像進行修復及品質提升的工具,VoxBox 則是聲音方面的一站式工具,提供以下對聲音相關的處理,能有效且大幅度的改善聲音品質:

  • 消除背景噪音:除去檔案中的所有背景噪音和背景音樂,僅保留聲音。
  • 提升音質:改善音訊的清晰度、平衡和整體音效,呈現錄音室品質的音質。
  • 淨化語音:去除口齒音、尖銳的「S」音和爆音的「P」音。
  • 修正音量:調整低音量音訊到正常音量,並將不同音量段落調整到相同音量。
iMyFone VoxBox - TTS 文字轉語音的配音專家 - 8

AI 生成饒舌歌曲

VoxBox 提供一個有趣的功能是 AI 生成饒舌歌曲,點擊生成 AI 歌詞後,給 AI 一個 prompt,例如小蛙這邊輸入「中文歌詞,關於台灣小吃」,等待片刻 VoxBox 即生成關於台灣小吃的饒舌歌詞,可惜的是目前只有英文版~點擊右下角匯入歌詞開始製作 Rap

iMyFone VoxBox - TTS 文字轉語音的配音專家 - 9

主畫面右邊可選擇 Rapper 的聲音,下方設定 Rap 的節拍,設定完成後點擊「轉換」即可在下方下載產生出來關於台灣小吃的 Rap 饒舌歌曲囉!這個功能相當有趣,很少在其他軟體上看見類似功能。

iMyFone VoxBox - TTS 文字轉語音的配音專家 - 10

VoxBox 聲音製作

最後一個是聲音製作功能,VoxBox 根據匯入的聲音製作出自己專屬的聲音,專屬製作的聲音可以在前面提到的文字轉語音時使用。左側功能表切換到「聲音製作」,點擊「複製一個新聲音」

iMyFone VoxBox - TTS 文字轉語音的配音專家 - 11

匯入聲音的方式有兩種,一是「上傳影片或音檔」、二是直接「錄音」

iMyFone VoxBox - TTS 文字轉語音的配音專家 - 12

小蛙選擇上傳影片製作,接著選擇支援多語言的模型 2 後開始克隆

iMyFone VoxBox - TTS 文字轉語音的配音專家 - 13

克隆完成後,就可以在文字轉語音時選擇剛剛克隆的聲音

iMyFone VoxBox - TTS 文字轉語音的配音專家 - 14

小蛙測試了一下,克隆出來的聲音真的非常像,不過在咬字與重低音部分還是有那麼一點奇怪,例如:小 (ㄒㄧㄠˇ) 蛙會變成孝 (ㄒㄧㄠˋ) 蛙,有點類似「藥師少女的獨語」中,高順都把貓貓叫成小 (ㄒㄧㄠˋ) 貓的配音。扣除咬字問題,克隆出來的聲音跟小蛙原本聲音的真實度真的非常相似。

以上就是 iMyFone VoxBox 的實測分享,當初會接觸到 VoxBox 是因為發 YouTube 影片,有時沒辦法有適合錄音的環境,於是想找一套可以進行文字轉語音 TTS 的工具,而 VoxBox 也讓小蛙使用起來相當滿意。VoxBox 提供使用者免費試用,免費試用有文字轉語音 2,000 個字元及語音轉文字 5 分鐘的額度,讓有聲音處理需求的使用者先試試看效果好不好,效果滿意再考慮付費購買,最後附上 iMyFone VoxBox 各種計畫的定價給各位讀者參考,有興趣的朋友快去下載 VoxBox 試用看看吧!

iMyFone VoxBox - TTS 文字轉語音的配音專家 - 15

    發佈留言

    發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

    這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料