"VoCo: Text-based Insertion and Replacement in Audio Narration"
音頻編輯技術(shù)VoCo:基于文本的插入和替換
本期介紹文字語(yǔ)音轉(zhuǎn)換技術(shù)。也就是,我們寫(xiě)下一段文字,計(jì)算機(jī)把文字轉(zhuǎn)化成語(yǔ)音。這在閱讀新聞或者在無(wú)官方旁白的情況下,對(duì)于創(chuàng)作有聲讀物非常有用。
一般來(lái)講,我們可以獲取語(yǔ)音波形,也可以對(duì)語(yǔ)音波形進(jìn)行編輯。但手工波形則非常困難,因?yàn)閭鹘y(tǒng)技術(shù)通常無(wú)法準(zhǔn)確地找到波形中單詞或字母的分界,更不用說(shuō)編輯了。
有了這種技術(shù),我們可以剪切、復(fù)制甚至編輯文本。這項(xiàng)工作由普林斯頓大學(xué)和Adobe的研究人員共同完成,被Adobe自詡為配音界的Photoshop。