(相關(guān)資料圖)
快科技6月19日消息,近日,Meta發(fā)布了Voicebox AI模型,它在音頻模擬方面有著顯著優(yōu)勢(shì)。
據(jù)悉,Voicebox只需要一段2秒鐘的音頻樣本,即可準(zhǔn)確辨別出音頻細(xì)節(jié)、音色,并基于文字結(jié)果轉(zhuǎn)換為語音輸出。
同時(shí),它還可以基于語音片段的前后內(nèi)容,自動(dòng)補(bǔ)齊中間缺失的內(nèi)容。
根據(jù)Meta的介紹,Voicebox能夠?yàn)锳I助手,或是未來元宇宙的NPC提供自然且真實(shí)的語音效果,大大提升用戶使用時(shí)的沉浸感。
同時(shí),它也能夠?yàn)槁晭軗p的人群提供協(xié)助,幫助TA們重新“發(fā)聲”。
值得一提的是,Meta目前已經(jīng)意識(shí)到了Voicebox被應(yīng)用在造假領(lǐng)域時(shí),存在的潛在危害,因此他們正在尋找一種區(qū)分真實(shí)語音和Voicebox生成語音的方法。
在找到解決方法前,Meta將不會(huì)向公眾公開Voicebox AI模型,以避免不必要的危害。
最新資訊
關(guān)于我們| 聯(lián)系方式| 版權(quán)聲明| 供稿服務(wù)| 友情鏈接
咕嚕網(wǎng) www.ulq4xuwux.cn 版權(quán)所有,未經(jīng)書面授權(quán)禁止使用
Copyright©2008-2023 By All Rights Reserved 皖I(lǐng)CP備2022009963號(hào)-10
聯(lián)系我們: 39 60 29 14 2@qq.com