首頁(yè)>資訊 >
Meta發(fā)布Voicebox AI模型:能夠生成用于回復(fù)的音頻消息 2023-06-20 11:23:58  來(lái)源:TechWeb

6 月 19 日消息,Meta 目前發(fā)布了 Voicebox AI 模型,相對(duì)于只能使用文字或圖片回復(fù)的競(jìng)品模型,Voicebox AI 模型的優(yōu)勢(shì)主要如其名,能夠生成用于回復(fù)的音頻消息。

據(jù)悉,Voicebox AI 模型只需要一段 2 秒鐘的音頻樣本,即可準(zhǔn)確辨別出音頻細(xì)節(jié)、音色,并基于文字結(jié)果轉(zhuǎn)換為語(yǔ)音輸出,支持英語(yǔ)、法語(yǔ)、德語(yǔ)、西班牙語(yǔ)。此外,Voicebox 還具備“基于語(yǔ)音片段前后內(nèi)容來(lái)補(bǔ)齊中間缺失內(nèi)容”的能力。

Meta 表示,Voicebox 可以為基于 AI 的虛擬助手或元宇宙中的 NPC 提供自然而真實(shí)的語(yǔ)音效果。而對(duì)于無(wú)障礙方面而言,Voicebox 也可以對(duì)聲帶受損的人群提供一定的協(xié)助作用。

IT之家經(jīng)過(guò)查詢得知,Voicebox AI 模型目前仍處于研發(fā)階段。Meta 表示,他們意識(shí)到這種人工智能技術(shù)在虛假偽造方面,可能會(huì)帶來(lái)潛在危害,因此 Meta 目前正在努力找到一種有效的方式來(lái)區(qū)分真實(shí)語(yǔ)音和由 Voicebox 生成的音頻,在找到解決方案前,暫時(shí)不會(huì)向公眾公開(kāi)提供。目前可以在這里找到 Voicebox 模型的更多信息。

關(guān)鍵詞:

相關(guān)閱讀:
熱點(diǎn)
圖片