Meta推出Seamless M4T AI模型翻译100种语言

2023年8月23日下午9:24 • 最新资讯

Meta于周二宣布推出Seamless M4T AI模型，展示其通用语言翻译方向的成果。此模型能快速、有效地理解多达100种语言的语音或文字，并生成翻译，甚至从文字生成语音。

近100种语言的语音识别
近 100 种输入和输出语言的语音转文字翻译
支持近 100 种输入语言和 36 种（包括英文）输出语言的语音转语音翻译
近 100 种语言的文字转文字翻译
支持近 100 种输入语言和 35 种（包括英文）输出语言的文字转语音翻译

近100种不同语言进行语音识别

Meta 于网志文章中描述其新的翻译系统为「第一个集多模态和多语言 AI 翻译模型于一身」的系统，能够为近 100 种不同语言进行语音识别和语音至文字的翻译。 Seamless M4T 亦能理解用户在句子中间更换语言，这对于翻译那些在讲话时混合使用不同语言部分的人来说，可能有所帮助。与过去的翻译模型不同，SeamlessM4T 使用一个单一系统，Meta 相信这最终将减少错误和延迟，提高质量。

Creative Commons 授权释出

Meta 将 Seamless M4T 以 Creative Commons 授权释出，以便其他翻译人员和 AI 研究人员可以研发。该公司还将发布SeamlessAlign的元数据，其中包含超过270，000小时的挖掘语音和文字。 Meta 声称这是此类数据集中最大的一个。

整合 WhatsApp/Messenger

未来公司会将这些 AI 翻译技术整合在旗下的 Facebook、Instagram、WhatsApp、Messenger 及 Threads 产品之中。外界估计，WhatsApp 及 Messenger 将可加入「语音消息」变成「文字」功能。

原创文章，作者：校长，如若转载，请注明出处：https://www.yundongfang.com/Yun250402.html

翻译语言语音

打赏

微信扫一扫不于多少！

支付宝扫一扫礼轻情意重

百度的Ernie 4取代ChatGPT4，将于今年推出

上一篇 2023年8月23日

认识Meta SeamlessM4T：多语言翻译

下一篇 2023年8月23日

iCloud同步列表中缺少语音备忘录选项：修复

使用Apple设备有其自身的优势，因为您的所有联系人，备忘录，便笺，钱包，照片都会自动同步。但是，在同步iCloud设置时，您可能看不到“语音备忘录”选项。如果您受到此问题的影响，…

2024年6月4日 • 苹果Apple
工具软件

Supertone Shift：实时 AI 语音变声器

Supertone Shift：实时 AI 语音变声器 Supertone Shift是由韩国Supertone公司推出的一款实时语音变换软件，旨在为用户提供高品质和个性化的声音转…

2024年5月20日
工具软件

Voicenotes：语音笔记 APP

Voicenotes：语音笔记 APP voicenotes 是个 AI 笔记应用以录音为主。支持 AI 搜索语音笔记、分享以及改改笔记的属性，比如将笔记转成代办。全部都是 AI…

2024年5月20日
工具软件

SecBrain：AI 语音笔记应用

SecBrain：AI 语音笔记应用 SecBrain 正在开发一款 AI 智能应用，旨在简化创建和管理语音笔记的流程。用户可以录制语音，应用随后自动为其生成对应的图标、标题、摘要…

2024年5月10日
Friend：开源的语音对话AI 硬件

Friend：开源的语音对话AI 硬件轻松捕捉对话。只需将其连接到移动设备，无论您走到哪里，都会自动保存会议、聊天和语音备忘录的高质量转录。获取即时摘要、重点亮点、思维导图、待…

工具软件 2024年5月10日
工具软件

Reka Core 发布，一个 GPT-4 级别的多模态 LLM

Reka Core 发布，一个 GPT-4 级别的多模态 LLM Reka Core 发布，一个 GPT-4 级别的多模态 LLM 。看了一下介绍确实非常强大。它具有图像、视频和音…

2024年5月10日
Miraa： AI驱动的语言跟读学习

Miraa： AI驱动的语言跟读学习 Miraa是一个利用人工智能技术为媒体生成双语字幕和学习材料的应用。设计和体验都非常好。它具有以下特点: 使用AI将媒体转录为字幕[ 根据指…

工具软件 2024年5月10日
工具软件

Hume 发布第一个可以感知对话者情绪的语音 AI EVI

Hume 发布第一个可以感知对话者情绪的语音 AI EVI Hume 发布第一个可以感知对话者情绪的语音 AI EVI。而且可以跟任何 LLM 兼容。 EVI有下面的一些特点：它…

2024年5月10日
工具软件

Open AI 发布了语音克隆方案及Sora艺术家测试视频

Open AI 发布了语音克隆方案及Sora艺术家测试视频多模态的任何一环Open AI都想做啊，这个语音克隆的功能也上了，声音和面部以及身体数据是未来内容生产能力爆炸之后，每个…

2024年5月10日
工具软件

Stability AI 引入的 StableCode Instruct 3B 编码 AI 模型

Stability AI 引入的 StableCode Instruct 3B 编码 AI 模型 Stability AI 推出了 StableCode Instruct 3B，这…

2024年3月28日
VoiceCraft：超过XTTS的语音模型

VoiceCraft：超过XTTS的语音模型 VOICECRAFT模型介绍： VOICECRAFT是一个先进的神经编解码语言模型，专门用于语音编辑和零样本文本到语音（TTS）任务。…

工具软件 2024年3月26日
工具软件

Open Interpreter 开源O1语音智能助手

Open Interpreter 开源O1语音智能助手一个完全开源的可以控制家里电脑的AI语音设备O1，介绍视频已翻译。它可以看到你的屏幕内容学习使用你常用的应用，并且你无论在哪…

2024年3月26日
如何将键盘设置更改为默认值 Windows 11？

如果您遇到键盘问题，则需要将键盘设置重置为默认值。在本指南中，我们将讨论将键盘设置更改回正常状态的步骤。如何将键盘设置更改回正常？ 1. 再次选择首选语言按 + 打开“设置”应…

2024年3月18日 • Win 11
工具软件

如何创建能够拨打和接听电话的会说话的 AI 助手

如何创建能够拨打和接听电话的会说话的 AI 助手在当今快节奏的商业世界中，自动化潜在客户培育流程可以显着提高效率和生产力。通过利用人工智能驱动的语音助手和 Zapier 等无代码…

2024年3月17日
微软Microsoft

Windows 11 的语音识别将在六个月内被砍掉，但它可以在 Windows 10 上运行

Microsoft此前宣布弃用Windows Speech Recognition（WSR）和其他几个应用程序。令人惊讶的是，新的语音访问应用程序现在将于 2024 年 9 月取代…

2024年3月15日
翻译 Canva 设计的 2 种方法

Canva允许你创建任意数量的设计，但有时你可能只想使用相同的内容和图形，以不同的语言提供你的内容。如果您的工作涉及与国际客户打交道或接触更广泛的受众，您可能需要更改设计的语言，以…

2024年2月4日 • 工具软件
在 iPhone 上更改语言的 3 种方法

众所周知，iPhone 是所有电子产品中最人性化的，其中一个原因是它们可以根据您的喜好轻松进行个性化设置。在您可以个性化的内容中，您可以将语言更改为其他语言，这与您在设置 iPho…

2024年1月20日 • 苹果Apple
“大型语言模型”和“LLM”这些术语将变得不那么常见

“大型语言模型”和“LLM”这些术语将变得不那么常见在当今人工智能领域，“大型语言模型”（及其缩写LLM）经常被用作“任何先进人工智能模型”的简称。这是可以理解的，因为许多最初崭…

工具软件 2023年12月30日
TextDiffuser-2：为文本渲染释放语言模型的力量

TextDiffuser-2：为文本渲染释放语言模型的力量可以稳定在扩散模型中生成指定位置和风格的英文文本，它是借助的微调后的大语言模型来规划文本布局，以及编码文本的位置。

工具软件 2023年12月26日
工具软件

Microsoft正在扼杀 Windows 11 上的 Windows Vista 时代的语音识别

Microsoft 将在即将发布的 Windows 11 中结束对 Windows 语音识别功能的支持。借助语音识别，您可以教操作系统理解您的声音并打开应用程序或口述命令，但现在是…

2023年12月25日
AI 工具推荐

支持 31 种语言的翻译工具我们在日常学习工作中经常需要进行大量的翻译，特别是对于在外企，常常需要对整个文件进行翻译，同时有写作的需求。那么 DeepL 既能满足 31 种语言翻译…

工具软件 2023年12月22日
工具软件

ChatGPT 语音功能现已全面开放

ChatGPT 的语音功能现已面向所有免费用户开放。意味着无需支付任何费用，就能与 ChatGPT 进行自然的对话，体验犹如与真人交流一般的奇妙互动。在 Google Play …

2023年12月21日
工具软件

Runway ：上线文字生成语音功能

Runway ：上线文字生成语音功能尝试了一下英文的效果真的很好，感情很丰富自然。中文还是老问题，有外国人口音，这块可能不能指望外国公司了。这个功能可以选的语音模型非常多，可以都…

2023年12月19日
iOS 17.2：如何使用 iPhone 的操作按钮翻译语音

在 iOS 17.2 中，使用 iPhone 操作按钮的新自定义翻译选项克服沟通障碍。继续阅读以了解如何使用它。如果您的 iPhone 带有操作按钮，例如 iPhone 15 P…

2023年12月15日 • 苹果Apple
工具软件

大型语言模型的最佳大小是多少

当涉足语言模型的世界时，人们很容易认为模型越大，它的性能就越好。这个概念植根于这样一种信念，即更多的数据和更多的参数意味着模型可以做更多的事情。但现实并非如此简单。语言模型的理想大…

2023年12月15日

Meta推出Seamless M4T AI模型翻译100种语言

近100种不同语言进行语音识别

Creative Commons 授权释出

整合 WhatsApp/Messenger

相关推荐