Open AI 发布了语音克隆方案及Sora艺术家测试视频
多模态的任何一环Open AI都想做啊,这个语音克隆的功能也上了,声音和面部以及身体数据是未来内容生产能力爆炸之后,每个人线上线下自我认同的纽带。
OpenAI 正在开发一个名为 Voice Engine 的模型,它可以使用文本输入和一个 15 秒的音频样本生成与原始说话者非常相似的自然语音。他们目前正在与一小群可信赖的合作伙伴进行小规模测试,以更好地了解该技术的潜在用途[。一些早期的应用包括:
- 为非读者和儿童提供阅读辅助,使用更广泛的说话者的自然、富有情感的声音。
- 翻译视频和播客等内容,让创作者和企业能够用自己的声音流利地接触全球更多人。
- 在偏远地区改善基本服务,用每个社区卫生工作者的主要语言提供互动反馈。
- 为非语言障碍者提供支持,如为影响语言能力的个人提供治疗应用。
- 帮助患有突发或退行性语言障碍的患者恢复语言能力。
OpenAI 认识到生成类似人声的语音存在严重风险,因此正在与各方合作伙伴接触,以确保在开发过程中吸收他们的反馈。他们还实施了一系列安全措施,包括水印和主动监控。
另一件事是Open AI发布几位艺术家和创意人员使用 OpenAI 的新模型 Sora 的初步体验和感受。
视频可以在这里查看:https://openai.com/blog/sora-first-impressions
AI21 Lab 推出了一种新的 LLM 架构 Mamba
原创文章,作者:校长,如若转载,请注明出处:https://www.yundongfang.com/Yun295714.html