OpenAI Whisper模型现已在Microsoft的Azure OpenAI服务和Azure AI Speech服务中可用

2023年9月18日下午8:25 • 工具软件

Microsoft就宣布OpenAI Whisper模型将很快出现在Azure OpenAI服务中。上周五，Microsoft宣布OpenAI Whisper模型现在可供使用Azure OpenAI服务和Azure AI Speech服务的客户使用。

OpenAI 耳语模型是一个神经网络，可以用 57 种语言执行语音识别和翻译任务。它是在从网络收集的大量多样化的音频和文本数据集上进行训练的。它使用基于变压器编码器-解码器架构的简单端到端方法，并且可以生成具有增强可读性和短语级时间戳的成绩单。

企业现在可以使用以下两种方式构建基于 OpenAI Whisper 模型的应用程序：

Azure OpenAI 服务中的 OpenAI 耳语模型：

OpenAI已经自己提供了Whisper API。使用这个新的Azure OpenAI服务，开发人员可以在特性和功能（包括转录和翻译功能）中使用相同的OpenAI Whisper API。可以在 Azure OpenAI 服务门户中找到 Whisper 模型的用于听录和转换的 REST API。

Azure AI 语音中的 OpenAI 耳语模型：

Azure AI 语音的用户现在可以将新的 OpenAI 的耳语模型与现有的 Azure AI 语音批量听录 API 结合使用。Azure AI 语音中的 Whisper 用户受益于现有功能，包括异步处理、说话人分割、自定义和更大的文件大小。在下面找到详细信息。

大文件大小：Azure AI 语音通过启用最大 1GB 的文件来增强耳语听录，并通过允许在单个请求中批处理多达 1000 个文件来处理大量文件的能力。
时间戳： 使用 Azure AI 语音，识别结果包括字级时间戳，从而能够识别音频中每个字词的发音位置。
扬声器分割：这是 Azure AI 语音的另一个有益功能，可识别音频文件中的各个说话人并标记其语音段。此功能允许客户区分说话者，准确转录他们的话，并创建更有条理和结构化的音频文件转录。
自定义/微调（即将推出）：Azure 语音中的自定义语音功能允许客户对自己的数据微调 Whisper，以提高识别准确性和一致性。

原创文章，作者：校长，如若转载，请注明出处：https://www.yundongfang.com/Yun256316.html

打赏

微信扫一扫不于多少！

支付宝扫一扫礼轻情意重

Midjourney v5.2提示逼真的电影照片AI艺术创作

上一篇 2023年9月18日下午8:21

Microsoft正在测试Edge中的另一个AI写入功能

下一篇 2023年9月18日

OpenAI o1 是什么？如何运作的

https://u.jd.com/daBByyr https://u.jd.com/d67YrPi OpenAI o1 可以通过复杂的任务进行推理，并解决比以前的科学、编码和数学模…

工具软件 2024年9月20日
iCloud同步列表中缺少语音备忘录选项：修复

使用Apple设备有其自身的优势，因为您的所有联系人，备忘录，便笺，钱包，照片都会自动同步。但是，在同步iCloud设置时，您可能看不到“语音备忘录”选项。如果您受到此问题的影响，…

2024年6月4日 • 苹果Apple
工具软件

Supertone Shift：实时 AI 语音变声器

Supertone Shift：实时 AI 语音变声器 Supertone Shift是由韩国Supertone公司推出的一款实时语音变换软件，旨在为用户提供高品质和个性化的声音转…

2024年5月20日
工具软件

Voicenotes：语音笔记 APP

Voicenotes：语音笔记 APP voicenotes 是个 AI 笔记应用以录音为主。支持 AI 搜索语音笔记、分享以及改改笔记的属性，比如将笔记转成代办。全部都是 AI…

2024年5月20日
Indigo关于发布会预测的整理

Indigo关于发布会预测的整理 GPT-4 的新版应该会按照参数规模不同分化成多个版本，这个和 Claude 还有 Gemini 多版本的逻辑一样；前两周出现在 llmsys …

工具软件 2024年5月20日
工具软件

SecBrain：AI 语音笔记应用

SecBrain：AI 语音笔记应用 SecBrain 正在开发一款 AI 智能应用，旨在简化创建和管理语音笔记的流程。用户可以录制语音，应用随后自动为其生成对应的图标、标题、摘要…

2024年5月10日
Friend：开源的语音对话AI 硬件

Friend：开源的语音对话AI 硬件轻松捕捉对话。只需将其连接到移动设备，无论您走到哪里，都会自动保存会议、聊天和语音备忘录的高质量转录。获取即时摘要、重点亮点、思维导图、待…

工具软件 2024年5月10日
工具软件

Hume 发布第一个可以感知对话者情绪的语音 AI EVI

Hume 发布第一个可以感知对话者情绪的语音 AI EVI Hume 发布第一个可以感知对话者情绪的语音 AI EVI。而且可以跟任何 LLM 兼容。 EVI有下面的一些特点：它…

2024年5月10日
工具软件

Open AI 发布了语音克隆方案及Sora艺术家测试视频

Open AI 发布了语音克隆方案及Sora艺术家测试视频多模态的任何一环Open AI都想做啊，这个语音克隆的功能也上了，声音和面部以及身体数据是未来内容生产能力爆炸之后，每个…

2024年5月10日
工具软件

OpenAI 让您无需注册即可使用 ChatGPT

OpenAI 正在消除使用 ChatGPT 的所有障碍，甚至不需要注册。该公司周一宣布，它允许用户无需注册即可开始使用聊天机器人。这里的目的是“让任何对人工智能能力感到好奇的人都能…

2024年4月6日
工具软件

新的 OpenAI 语音引擎项目

新的 OpenAI 语音引擎项目据报道，OpenAI正在开发一个新的语音引擎项目，该项目已通过最近的“语音引擎”商标申请得到暗示。该商标表明该项目可能涉及语音和语音识别、处理命令…

2024年3月26日
VoiceCraft：超过XTTS的语音模型

VoiceCraft：超过XTTS的语音模型 VOICECRAFT模型介绍： VOICECRAFT是一个先进的神经编解码语言模型，专门用于语音编辑和零样本文本到语音（TTS）任务。…

工具软件 2024年3月26日
工具软件

Open Interpreter 开源O1语音智能助手

Open Interpreter 开源O1语音智能助手一个完全开源的可以控制家里电脑的AI语音设备O1，介绍视频已翻译。它可以看到你的屏幕内容学习使用你常用的应用，并且你无论在哪…

2024年3月26日
工具软件

如何创建能够拨打和接听电话的会说话的 AI 助手

如何创建能够拨打和接听电话的会说话的 AI 助手在当今快节奏的商业世界中，自动化潜在客户培育流程可以显着提高效率和生产力。通过利用人工智能驱动的语音助手和 Zapier 等无代码…

2024年3月17日
工具软件

OpenAI 首席技术官透露可能的 Sora AI 视频生成器发布日期

OpenAI 首席技术官透露可能的 Sora AI 视频生成器发布日期 OpenAI 首席技术官（CTO） Mira Murati 在接受《华尔街日报》采访时，对 OpenAI …

2024年3月15日
微软Microsoft

Windows 11 的语音识别将在六个月内被砍掉，但它可以在 Windows 10 上运行

Microsoft此前宣布弃用Windows Speech Recognition（WSR）和其他几个应用程序。令人惊讶的是，新的语音访问应用程序现在将于 2024 年 9 月取代…

2024年3月15日
工具软件

OpenAI 终于推出了 GPT 商店：一个自定义的 GPT 共享平台

经过几个月的延迟，OpenAI 终于向 GPT Store 敞开了大门——这是一个供用户查找用户创建的流行自定义版本的 ChatGPT 的平台。自引入自定义 GPT 构建器以来，…

2024年1月15日
工具软件

OpenAI 终于推出了 GPT 商店：一个自定义的 GPT 共享平台

经过几个月的延迟，OpenAI 终于向 GPT Store 敞开了大门——这是一个供用户查找用户创建的流行自定义版本的 ChatGPT 的平台。自引入自定义 GPT 构建器以来，…

2024年1月12日
工具软件

Open AI将成为美国二大最有价值的初创公司，仅次于SpaceX

Open AI将成为美国二大最有价值的初创公司，仅次于SpaceX 上周有消息说OpenAI正在初步讨论以1000亿美元或以上的估值筹集新一轮资金，同时2023年的利润将会达到16…

2024年1月2日
工具软件

从初学者到专业人士：2024 年 ChatGPT 精通指南

ChatGPT 是 OpenAI 的革命性语言模型，风靡全球。它能够生成逼真的文本、翻译语言、编写不同类型的创意内容以及以信息丰富的方式回答您的问题，开辟了一个充满可能性的新时代。…

2023年12月29日
工具软件

Microsoft正在扼杀 Windows 11 上的 Windows Vista 时代的语音识别

Microsoft 将在即将发布的 Windows 11 中结束对 Windows 语音识别功能的支持。借助语音识别，您可以教操作系统理解您的声音并打开应用程序或口述命令，但现在是…

2023年12月25日
工具软件

ChatGPT 语音功能现已全面开放

ChatGPT 的语音功能现已面向所有免费用户开放。意味着无需支付任何费用，就能与 ChatGPT 进行自然的对话，体验犹如与真人交流一般的奇妙互动。在 Google Play …

2023年12月21日
工具软件

2023 年的 AI 突破、发展和工具

在过去的一年里，人工智能（AI）在科技领域取得了长足的进步，改变了我们与数字设备和内容互动的方式。OpenAI、Microsoft、谷歌等主要科技公司在 2023 年一直处于这…

2023年12月21日
工具软件

Runway ：上线文字生成语音功能

Runway ：上线文字生成语音功能尝试了一下英文的效果真的很好，感情很丰富自然。中文还是老问题，有外国人口音，这块可能不能指望外国公司了。这个功能可以选的语音模型非常多，可以都…

2023年12月19日
工具软件

Azure AI 中提供的 Microsoft AI 模型即服务 – Phi-2、Orca 2、Llama 2

Microsoft 通过其新的 AI 模型即服务增强了 Azure AI 功能，在人工智能领域向前迈出了重要一步。Microsoft 在扩展其 AI 产品方面取得了长足的进步，包括…

2023年12月15日

OpenAI Whisper模型现已在Microsoft的Azure OpenAI服务和Azure AI Speech服务中可用

相关推荐