Amphion-香港中文大学开源的音频、音乐和语音生成工具包

AIHub最新消息 12月18日,香港中文大学(深圳)武执政副教授带领的团队联合上海AI实验室等开源了音频、音乐和语音生成工具包Amphion v0.1版本。

除了文字转语音功能,Amphion还可以将一首歌的声音换成另一个歌手的声音,支持声音转换、歌声合成、文本到音频、文本到音乐等功能,歌声转换目前支持迈克尔·杰克逊、泰勒·斯威夫特、王菲、那英、李健等歌手的声音。该工具包支持多种模型和架构,如FastSpeech2、VITS、Vall-E、NaturalSpeech2等,用于不同的音频生成任务。

论文地址:arxiv.org/abs/2312.09911

AIHub试玩了一下,非常有意思,大家可以去体验一下。

声音转换Demo地址:

huggingface.co/spaces/amphion/singing_voice_conversion

Amphion-香港中文大学开源的音频、音乐和语音生成工具包

Previous Article
Next Article

发表回复

Your email address will not be published. Required fields are marked *.

*
*
You may use these <abbr title="HyperText Markup Language">HTML</abbr> tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>