Open AI 发布了语音克隆方案及Sora艺术家测试视频

2024年5月10日下午6:51 • 工具软件

Open AI 发布了语音克隆方案及Sora艺术家测试视频

多模态的任何一环Open AI都想做啊，这个语音克隆的功能也上了，声音和面部以及身体数据是未来内容生产能力爆炸之后，每个人线上线下自我认同的纽带。

OpenAI 正在开发一个名为 Voice Engine 的模型,它可以使用文本输入和一个 15 秒的音频样本生成与原始说话者非常相似的自然语音。他们目前正在与一小群可信赖的合作伙伴进行小规模测试,以更好地了解该技术的潜在用途[。一些早期的应用包括:

为非读者和儿童提供阅读辅助,使用更广泛的说话者的自然、富有情感的声音。
翻译视频和播客等内容,让创作者和企业能够用自己的声音流利地接触全球更多人。
在偏远地区改善基本服务,用每个社区卫生工作者的主要语言提供互动反馈。
为非语言障碍者提供支持,如为影响语言能力的个人提供治疗应用。
帮助患有突发或退行性语言障碍的患者恢复语言能力。

OpenAI 认识到生成类似人声的语音存在严重风险,因此正在与各方合作伙伴接触,以确保在开发过程中吸收他们的反馈。他们还实施了一系列安全措施,包括水印和主动监控。

另一件事是Open AI发布几位艺术家和创意人员使用 OpenAI 的新模型 Sora 的初步体验和感受。

视频可以在这里查看：https://openai.com/blog/sora-first-impressions

AI21 Lab 推出了一种新的 LLM 架构 Mamba

原创文章，作者：校长，如若转载，请注明出处：https://www.yundongfang.com/Yun295714.html

克隆视频语音

打赏

微信扫一扫不于多少！

支付宝扫一扫礼轻情意重

iCloud和FindMy在“设置”中变灰：如何修复

上一篇 2024年5月10日上午9:07

X AI 发布了Grok-1.5更新

下一篇 2024年5月10日下午6:52

阿里开源支持视频理解的多模态 LLM Qwen2-VL

阿里开源支持视频理解的多模态 LLM Qwen2-VL 国内现在还没有特别好的多模态闭源模型尤其是支持视频理解的，阿里这就开源了。不过最大的Qwen2-VL 72B 没有开源，只开…

工具软件 2024年9月20日
工具软件

Morphic Studio：为创建受控视频做的 AI 视频平台

Morphic Studio：为创建受控视频做的 AI 视频平台 Morphic Studio 包括 Canvas 和 Compose 功能，Canvas 是一个全面的故事板和生成…

2024年8月31日
工具软件

Clapper app：AI 剪辑工具

Clapper app：AI 剪辑工具非常强的网页端 AI 生成和视频剪辑工具。接入了 AI 视频需要的各种 API，包括图片生成、LLM、语音生成、音乐生成、视频生成。时间轴直…

2024年8月31日
iCloud同步列表中缺少语音备忘录选项：修复

使用Apple设备有其自身的优势，因为您的所有联系人，备忘录，便笺，钱包，照片都会自动同步。但是，在同步iCloud设置时，您可能看不到“语音备忘录”选项。如果您受到此问题的影响，…

2024年6月4日 • 苹果Apple
iPhone相机在室内灯光下闪烁/闪烁：修复

您的 iPhone 相机在室内灯光下闪烁或闪烁太多吗？您用 iPhone 拍摄的视频看起来不太好，因为灯光会亮起。您在视频上看到的闪烁是因为刷新率的差异。这是不正常的，有一些方法可…

2024年6月1日 • 苹果Apple
工具软件

viva：首个可供使用的 Dit 架构视频生成工具

viva：首个可供使用的 Dit 架构视频生成工具海外产品 viva 发布了首个开放给全部用户使用的 Sora 同架构视频生成模型，而且现阶段免费。支持文本生成视频、图片生成视频…

2024年5月20日
工具软件

Supertone Shift：实时 AI 语音变声器

Supertone Shift：实时 AI 语音变声器 Supertone Shift是由韩国Supertone公司推出的一款实时语音变换软件，旨在为用户提供高品质和个性化的声音转…

2024年5月20日
工具软件

Voicenotes：语音笔记 APP

Voicenotes：语音笔记 APP voicenotes 是个 AI 笔记应用以录音为主。支持 AI 搜索语音笔记、分享以及改改笔记的属性，比如将笔记转成代办。全部都是 AI…

2024年5月20日
工具软件

SecBrain：AI 语音笔记应用

SecBrain：AI 语音笔记应用 SecBrain 正在开发一款 AI 智能应用，旨在简化创建和管理语音笔记的流程。用户可以录制语音，应用随后自动为其生成对应的图标、标题、摘要…

2024年5月10日
Friend：开源的语音对话AI 硬件

Friend：开源的语音对话AI 硬件轻松捕捉对话。只需将其连接到移动设备，无论您走到哪里，都会自动保存会议、聊天和语音备忘录的高质量转录。获取即时摘要、重点亮点、思维导图、待…

工具软件 2024年5月10日
工具软件

生数科技发布Vidu 视频生成模型

生数科技发布Vidu 视频生成模型生数科技不声不响整了个大活。发布 Vidu 视频生成模型，支持长达 16 秒 1080P 视频直接生成。从演示视频来看一致性、运动幅度都达到了…

2024年5月10日
Captions：AI 自动视频剪辑工具

Captions：AI 自动视频剪辑工具 Captions 这个产品可以自动识别超长视频的有价值判断并且自动剪辑成多条适合传播的短视频。生成的短视频可以选择对应的字幕模板，并且支…

工具软件 2024年5月10日
360 AI 浏览器支持 Youtube 视频

360 AI 浏览器支持 Youtube 视频 LLM 的出现让英语知识的获取变得比以前简单非常多，尤其是文字类的内容，翻译以及总结门槛都低了非常多。但是很多知识都在视频里面，我…

工具软件 2024年5月10日
工具软件

Hume 发布第一个可以感知对话者情绪的语音 AI EVI

Hume 发布第一个可以感知对话者情绪的语音 AI EVI Hume 发布第一个可以感知对话者情绪的语音 AI EVI。而且可以跟任何 LLM 兼容。 EVI有下面的一些特点：它…

2024年5月10日
工具软件

Adobe 的 VideoGigaGAN 项目可以将模糊的视频变成高清

Adobe 的人们开发了一种生成式 AI 模型，该模型很快就会让您将视频升级到原始分辨率的八倍。Adobe在最近发表的一篇名为VideoGigaGAN的论文中声称，该模型远远优于过…

2024年4月25日
工具软件

WhatsApp将获得基于文本的状态更新的新界面以及转发和快退视频的能力

WhatsApp 通过定期更新不断改进。最近的报道表明，WhatsApp正在开发一个新的状态更新界面，为基于文本的更新提供自己的空间。此外，WhatsApp 还改进了平台上的视频播…

2024年4月6日
苹果Apple

如何在iPhone照片应用程序上编辑视频

如何在iPhone照片应用程序上编辑视频在不断发展的数字媒体世界中，视频的质量可以产生重大影响。将 iPhone 放在口袋里，您可以使用一个非常强大的工具来捕获和编辑视频，这些视…

2024年3月29日
苹果Apple

如何在iPhone照片应用程序上编辑视频

如何在iPhone照片应用程序上编辑视频在不断发展的数字媒体世界中，视频的质量可以产生重大影响。将 iPhone 放在口袋里，您可以使用一个非常强大的工具来捕获和编辑视频，这些视…

2024年3月28日
苹果Apple

如何加快iPad的使用速度

如何加快iPad的使用速度寻找更快、更智能地完成工作的方法几乎是每个人的首要任务。iPad 是每个人的首选小工具，从忙碌的专业人士到创意人士和学生，它提供的远不止眼前所见。幸运的…

2024年3月26日
工具软件

5 种 AI 工具可改善您的视频编辑并节省时间

5 种 AI 工具可改善您的视频编辑并节省时间如果您正在寻找减少编辑视频时间的方法，您可能会对五种 AI 工具感兴趣，它们不仅可以改善您的视频编辑工作流程，还可以节省您的时间。您…

2024年3月26日
工具软件

Open-Sora 开源替代 OpenAI 的 Sora 文本转视频 AI

Open-Sora 开源替代 OpenAI 的 Sora 文本转视频 AI 继今年早些时候推出 Sora 之后，OpenAI 强大的文本到视频 AI 模型以 Open-Sora 的…

2024年3月26日
工具软件

Stable Video 3D 从单个图像创建动画

Stable Video 3D 从单个图像创建动画如果您有兴趣使用新的 Stable Video 3D（Stability AI 发布的工具）从单个图像创建 3D 外观的视频，并…

2024年3月26日
苹果Apple

20 iPhone 15 和 15 Pro 相机提示和技巧

20 iPhone 15 和 15 Pro 相机提示和技巧 iPhone 15 系列再次提升了移动摄影和摄像的标准，其先进的相机功能有望将每个用户转变为熟练的内容创作者。无论你是经…

2024年3月26日
VoiceCraft：超过XTTS的语音模型

VoiceCraft：超过XTTS的语音模型 VOICECRAFT模型介绍： VOICECRAFT是一个先进的神经编解码语言模型，专门用于语音编辑和零样本文本到语音（TTS）任务。…

工具软件 2024年3月26日
Mora：借助多智能体系统实现通用视频生成

Mora：借助多智能体系统实现通用视频生成微软的一个视频生成项目 Mora，利用 Agents 来复原 Sora 的能力，基本还原了 Sora 所有的能力，目前支持生成 1024…

工具软件 2024年3月26日

Open AI 发布了语音克隆方案及Sora艺术家测试视频

相关推荐