如何使用 AudioBox Meta 的新文本转声音 AI 工具

2023年12月14日下午11:12 • 工具软件

Meta 本月推出了一款名为 AudioBox 的新 AI 声音发生器，它将改变我们与声音互动的方式。这个创新工具允许用户使用简单的文本提示轻松将文本转换为语音、创作音乐和创建声音效果。AudioBox 的推出标志着在使广大用户更容易创建自定义音频内容方面迈出了重要一步。

Meta 的 Audiobox 文本转声音音频创作系统是 Voicebox 的继任者。通过统一语音、音效（短促、离散的声音，如狗吠声、汽车喇叭声、雷声等）和音景的生成和编辑功能，进一步推进音频生成式 AI，并采用各种输入机制，最大限度地提高每个用例的可控性。

AudioBox 具有多种功能，可满足各种音频生成需求。例如，它的文本转语音功能使用户能够将书面文本转换为逼真的语音，并提供一系列语音选项供您选择。那些对音乐感兴趣的人可以使用 AudioBox 制作音乐曲目，而无需掌握传统乐器或复杂的软件。此外，该工具能够产生量身定制的声音效果，这对于游戏、电影和其他多媒体项目特别有用。用户可以使用直观的文本或音频提示根据自己的特定需求自定义音频输出。

文本到声音 AI 音频生成

Meta 设计了 Audiobox，使人们能够使用自然语言提示来描述他们想要创建的声音或语音类型来创建声音。例如，如果您想创建新声音，只需在 AI 模型中输入文本提示，例如“流淌的河流和鸟儿的鸣叫”。观看下面的视频，了解其当前功能的概述和演示。

此外，AudioBox 不仅仅是一个基本的声音发生器;它包括突破 AI 生成音频界限的高级功能。其中一项功能是

语音克隆

，它允许复制样本中的任何声音，从而提供个性化的音频创作体验。该工具还可以重新设置现有音频的样式以适应不同的上下文，并使用 AI 生成的内容无缝编辑或替换音频片段，这一过程称为音频修复。

“Audiobox在语音和声音效果生成方面展示了最先进的可控性。我们自己的测试表明，在主观评估中，它在质量和相关性（忠实于文本描述）方面明显优于之前的最佳模型（AudioLDM2、VoiceLDM 和 TANGO）。Audiobox在各种语音风格的风格相似度上比Voicebox高出30%以上。

供货情况和定价

Meta 目前正在向一组精心挑选的研究人员和学术机构提供 Audiobox，这些研究人员和学术机构在语音研究方面有着良好的记录，以帮助进一步推动该研究领域的技术发展。该公司致力于确保以合乎道德和负责任的方式使用 AudioBox。该公司已经实施了保障措施，以防止潜在的滥用，并确保人工智能遵守道德准则。这种对道德使用的承诺通过支持对 AudioBox 安全应用研究的赠款申请进一步证明。

AudioBox 的另一个令人兴奋的功能是 AudioBox Maker，它允许用户通过分层声音和音乐来构建复杂的音频场景。这样可以创建复杂而身临其境的音景，从而增强任何音频体验。Meta 的 Audiobox 交互式演示和研究论文现已推出，让您可以测试音频生成的新基础研究模型。

AudioBox有望对音频制作行业产生重大影响。其全面的功能和对道德使用的奉献精神意味着内容创作者、音乐家和开发人员可以期待新的可能性领域。当我们等待 AudioBox 的进一步更新时，包括其潜在的开源版本以及正在进行的安全和责任研究的结果，很明显，该工具将成为音频制作领域不可或缺的资产。

原创文章，作者：校长，如若转载，请注明出处：https://www.yundongfang.com/Yun270864.html

声音语音音频

打赏

微信扫一扫不于多少！

支付宝扫一扫礼轻情意重

25+ 免费 AI 工具，可提高您的生产力和工作流程

上一篇 2023年12月14日下午11:11

如何使用 Google Bard 破解假期：节日效率指南

下一篇 2023年12月14日下午11:12

iCloud同步列表中缺少语音备忘录选项：修复

使用Apple设备有其自身的优势，因为您的所有联系人，备忘录，便笺，钱包，照片都会自动同步。但是，在同步iCloud设置时，您可能看不到“语音备忘录”选项。如果您受到此问题的影响，…

2024年6月4日 • 苹果Apple
已解决：Microsoft商店中缺少Realtek音频控制台

https://u.jd.com/kz2KLti 我们都使用Microsoft商店作为应用程序的一站式商店，但是当Realtek音频控制台丢失时，它引出了一个问题，这是商店问题还是…

2024年5月29日 • 微软Microsoft
Spotify 无损（几乎）在这里，但不要抱有希望！

经过多年的失望等待，Spotify用户以研究的怀疑态度看待有关Spotify无损音频的大多数泄漏和猜测。谁能责怪他们？自宣布以来已经三年了，几乎没有关于确切发布日期的消息！因此，每…

2024年5月20日 • 工具软件
工具软件

Supertone Shift：实时 AI 语音变声器

Supertone Shift：实时 AI 语音变声器 Supertone Shift是由韩国Supertone公司推出的一款实时语音变换软件，旨在为用户提供高品质和个性化的声音转…

2024年5月20日
工具软件

Voicenotes：语音笔记 APP

Voicenotes：语音笔记 APP voicenotes 是个 AI 笔记应用以录音为主。支持 AI 搜索语音笔记、分享以及改改笔记的属性，比如将笔记转成代办。全部都是 AI…

2024年5月20日
工具软件

SecBrain：AI 语音笔记应用

SecBrain：AI 语音笔记应用 SecBrain 正在开发一款 AI 智能应用，旨在简化创建和管理语音笔记的流程。用户可以录制语音，应用随后自动为其生成对应的图标、标题、摘要…

2024年5月10日
Friend：开源的语音对话AI 硬件

Friend：开源的语音对话AI 硬件轻松捕捉对话。只需将其连接到移动设备，无论您走到哪里，都会自动保存会议、聊天和语音备忘录的高质量转录。获取即时摘要、重点亮点、思维导图、待…

工具软件 2024年5月10日
工具软件

谷歌发布了一堆AI能力和升级

谷歌发布了一堆AI能力和升级 Google Next 2024上周放出了不少狠货，这次 Open AI 没能够压下去热度。首先是 Gemini Pro 1.5 进行了一大波升级，…

2024年5月10日
工具软件

Hume 发布第一个可以感知对话者情绪的语音 AI EVI

Hume 发布第一个可以感知对话者情绪的语音 AI EVI Hume 发布第一个可以感知对话者情绪的语音 AI EVI。而且可以跟任何 LLM 兼容。 EVI有下面的一些特点：它…

2024年5月10日
工具软件

Open AI 发布了语音克隆方案及Sora艺术家测试视频

Open AI 发布了语音克隆方案及Sora艺术家测试视频多模态的任何一环Open AI都想做啊，这个语音克隆的功能也上了，声音和面部以及身体数据是未来内容生产能力爆炸之后，每个…

2024年5月10日
无法在iPhone中发送音频消息：这是修复

无法在 iPhone 上从 iMessage 发送音频消息？音频消息始终优先于普通短信。它不仅速度快，而且比输入消息更方便。如果您无法发送音频消息，请不要担心。这些简短且易于实施的…

2024年5月3日 • 苹果Apple
如何使用 PowerToys 在 Windows 上查看音频文件

PowerToys 中的 Peek 实用程序现在支持预览音频文件。从 PowerToys 版本 0.80.0 开始，您将能够查看多种音频文件格式的内容，而无需在其专用应用程序中打开…

2024年4月11日 • Win 11
苹果Apple

iPhone声音问题？以下是修复它们的方法

iPhone声音问题？以下是修复它们的方法在 iPhone 上遇到声音问题会严重影响您的享受和整体用户体验。从缺少通知到静音的音乐和视频，甚至处理糟糕的音质，这些问题可能是一个真…

2024年3月26日
工具软件

Denon DHT-S218杜比全景声条形音箱推出

Denon DHT-S218杜比全景声条形音箱推出 Denon推出DHT-S218杜比全景声条形音箱（Dolby Atmos Sound Bar），这是一种高级音频解决方案，旨在将…

2024年3月26日
VoiceCraft：超过XTTS的语音模型

VoiceCraft：超过XTTS的语音模型 VOICECRAFT模型介绍： VOICECRAFT是一个先进的神经编解码语言模型，专门用于语音编辑和零样本文本到语音（TTS）任务。…

工具软件 2024年3月26日
工具软件

Open Interpreter 开源O1语音智能助手

Open Interpreter 开源O1语音智能助手一个完全开源的可以控制家里电脑的AI语音设备O1，介绍视频已翻译。它可以看到你的屏幕内容学习使用你常用的应用，并且你无论在哪…

2024年3月26日
苹果Apple

让自己在蜂窝 iPhone 通话中更容易听到

在 iPhone 上，Apple 提供了在蜂窝移动电话通话期间使用的语音隔离功能。继续阅读以了解语音隔离的功能以及如何启用它。在 iOS 15 及更高版本中，Apple 包含多项…

2024年3月24日
苹果Apple

让自己在蜂窝 iPhone 通话中更容易听到

在 iPhone 上，Apple 提供语音隔离功能，可在蜂窝网络通话期间使用。继续阅读以了解语音隔离的功能以及如何启用它。在 iOS 15 及更高版本中，Apple 包含多项新功…

2024年3月21日
工具软件

如何创建能够拨打和接听电话的会说话的 AI 助手

如何创建能够拨打和接听电话的会说话的 AI 助手在当今快节奏的商业世界中，自动化潜在客户培育流程可以显着提高效率和生产力。通过利用人工智能驱动的语音助手和 Zapier 等无代码…

2024年3月17日
微软Microsoft

Windows 11 的语音识别将在六个月内被砍掉，但它可以在 Windows 10 上运行

Microsoft此前宣布弃用Windows Speech Recognition（WSR）和其他几个应用程序。令人惊讶的是，新的语音访问应用程序现在将于 2024 年 9 月取代…

2024年3月15日
工具软件

如何使用 ElevenLabs 制作 AI 音效

如何使用 ElevenLabs 制作 AI 音效如果您正在寻找一种使用人工智能（AI）快速轻松地创建丰富不同音效以满足您所有需求的方法。在查看 ElevenLabs 的 AI…

2024年3月14日
如何在后台或锁定iPhone的情况下继续收听YouTube

在 iPhone 上，在后台收听 YouTube 音频通常需要支付 YouTube Premium 订阅费用，但有一个简单的解决方法可让您在 iPhone 上执行其他操作或设备锁定…

2023年12月29日 • 苹果Apple
工具软件

Microsoft正在扼杀 Windows 11 上的 Windows Vista 时代的语音识别

Microsoft 将在即将发布的 Windows 11 中结束对 Windows 语音识别功能的支持。借助语音识别，您可以教操作系统理解您的声音并打开应用程序或口述命令，但现在是…

2023年12月25日
MediaEditor：轻量、跨平台的开源非线性编辑

特征支持完整的时间线编辑功能，包括移动、裁剪、剪切、缩略图预览、缩放和删除。支持更加灵活便捷的蓝图系统。蓝图以节点的形式表示，可以通过节点和流程处理复杂的功能。支持约 45+…

工具软件 2023年12月23日
工具软件

ChatGPT 语音功能现已全面开放

ChatGPT 的语音功能现已面向所有免费用户开放。意味着无需支付任何费用，就能与 ChatGPT 进行自然的对话，体验犹如与真人交流一般的奇妙互动。在 Google Play …

2023年12月21日

如何使用 AudioBox Meta 的新文本转声音 AI 工具

文本到声音 AI 音频生成

供货情况和定价

相关推荐