Open AI 发布了语音克隆方案及Sora艺术家测试视频

Open AI 发布了语音克隆方案及Sora艺术家测试视频

多模态的任何一环Open AI都想做啊,这个语音克隆的功能也上了,声音和面部以及身体数据是未来内容生产能力爆炸之后,每个人线上线下自我认同的纽带。

OpenAI 正在开发一个名为 Voice Engine 的模型,它可以使用文本输入和一个 15 秒的音频样本生成与原始说话者非常相似的自然语音。他们目前正在与一小群可信赖的合作伙伴进行小规模测试,以更好地了解该技术的潜在用途[。一些早期的应用包括:

  • 为非读者和儿童提供阅读辅助,使用更广泛的说话者的自然、富有情感的声音。
  • 翻译视频和播客等内容,让创作者和企业能够用自己的声音流利地接触全球更多人。
  • 在偏远地区改善基本服务,用每个社区卫生工作者的主要语言提供互动反馈。
  • 为非语言障碍者提供支持,如为影响语言能力的个人提供治疗应用。
  • 帮助患有突发或退行性语言障碍的患者恢复语言能力。

OpenAI 认识到生成类似人声的语音存在严重风险,因此正在与各方合作伙伴接触,以确保在开发过程中吸收他们的反馈。他们还实施了一系列安全措施,包括水印和主动监控。

另一件事是Open AI发布几位艺术家和创意人员使用 OpenAI 的新模型 Sora 的初步体验和感受。

视频可以在这里查看:https://openai.com/blog/sora-first-impressions
po9lc88m.webp

AI21 Lab 推出了一种新的 LLM 架构 Mamba

原创文章,作者:校长,如若转载,请注明出处:https://www.yundongfang.com/Yun295714.html

(0)
打赏 微信扫一扫不于多少! 微信扫一扫不于多少! 支付宝扫一扫礼轻情意重 支付宝扫一扫礼轻情意重
上一篇 2024年5月10日 上午9:07
下一篇 2024年5月10日 下午6:52

相关推荐