OpenVoice:多功能实时语音克隆 My shell 的这个语音克隆技术上周爆了,只需要一小段说话内容就可以复制对应的声音并生成多种语言的声音。 除了复制参考说话者的音色之外,OpenVoice 还可以对语音风格进行精细控制,包括情感、口音、节奏、停顿和语调。 OpenVoice 的计算效率也很高,其成本比性能较差的商用 API 低数十倍。 论文:https://arxiv.org/pdf/2312.01479.pdf Github:https://github.com/myshell-ai/OpenVoice Mobile ALOHA:斯坦福家政机械臂

OpenVoice:多功能实时语音克隆

My shell 的这个语音克隆技术上周爆了,只需要一小段说话内容就可以复制对应的声音并生成多种语言的声音。

除了复制参考说话者的音色之外,OpenVoice 还可以对语音风格进行精细控制,包括情感、口音、节奏、停顿和语调。

OpenVoice 的计算效率也很高,其成本比性能较差的商用 API 低数十倍。

论文:https://arxiv.org/pdf/2312.01479.pdf

Github:https://github.com/myshell-ai/OpenVoice
5w70c2e5.webp

原创文章,作者:校长,如若转载,请注明出处:https://www.yundongfang.com/Yun272484.html

(0)
打赏 微信扫一扫不于多少! 微信扫一扫不于多少! 支付宝扫一扫礼轻情意重 支付宝扫一扫礼轻情意重
上一篇 2024年1月8日 上午10:27
下一篇 2024年1月8日 下午7:26

相关推荐