Insanely Fast Whisper：98秒的时间内转录5小时

2023年11月23日下午3:39 • 工具软件

基于Whisper-large-v3语音模型的快速转录，使用Transformers、Optimum 和 flash-attn 引擎，能在不到98秒的时间内转录5小时的音频，在Google Colab T4 GPU上进行的基准测试显示，使用不同优化方式可以显著减少音频转录时间。提供了命令行界面(CLI)，可通过pipx安装，支持快速转录和不同模型的选择

测试基准

Optimisation type	Time to Transcribe (150 mins of Audio)
Transformers (`fp32`)	~31 (31 min 1 sec)
Transformers (`fp16` + `batching [24]` + `bettertransformer`)	~5 (5 min 2 sec)
Transformers (`fp16` + `batching [24]` + `Flash Attention 2`)	~2 (1 min 38 sec)
distil-whisper (`fp16` + `batching [24]` + `bettertransformer`)	~3 (3 min 16 sec)
distil-whisper (`fp16` + `batching [24]` + `Flash Attention 2`)	~1 (1 min 18 sec)
Faster Whisper (`fp16` + `beam_size [1]`)	~9.23 (9 min 23 sec)
Faster Whisper (`8-bit` + `beam_size [1]`)	~8 (8 min 15 sec)

通过您的终端进行极快的转录！

我们添加了 CLI 来实现快速转录。使用方法如下：

使用 pipx 安装 insanely-fast-whisper ：

pipx install insanely-fast-whisper

从计算机上的任何路径运行推理：

insanely-fast-whisper --file-name <filename or URL>

您也可以从此 CLI 运行 Whisper-large-v3 w/ Flash Attention 2：

insanely-fast-whisper --file-name <filename or URL> --flash True

您也可以直接从此 CLI 运行 distil-whisper：

insanely-fast-whisper --model-name distil-whisper/large-v2 --file-name <filename or URL>

不想安装 insanely-fast-whisper ？只需使用 pipx run ：

pipx run insanely-fast-whisper --file-name <filename or URL>

注意：CLI 是固定的，目前仅适用于 Nvidia GPU。请务必检查默认设置和可以使用的选项列表，以最大限度地提高转录吞吐量。运行 insanely-fast-whisper --help 或 pipx run insanely-fast-whisper --help 以获取所有 CLI 参数和默认值。

项目链接

https://github.com/chenxwh/insanely-fast-whisper

原创文章，作者：校长，如若转载，请注明出处：https://www.yundongfang.com/Yun267389.html

打赏

微信扫一扫不于多少！

支付宝扫一扫礼轻情意重

Umi-OCR V2 文字识别工具 – 开源、免费、实用的离线OCR软件

上一篇 2023年11月23日下午3:38

GPT4 paper assistant: 用GPT-4建立的论文助手机器人项目

下一篇 2023年11月23日下午3:40

微软Microsoft

Microsoft 引入了新的 Windows 11 24H2 更新 CPU 要求

Microsoft 最近增强了即将推出的 Windows 11 版本 24H2 的系统要求，表明有意阻止非常旧的处理器运行最新的操作系统。随着上个月向 Canary 频道发布 Wi…

2024年4月25日
Win 11

被黑客利用的Windows DOS到NT路径转换过程

SafeBreach 安全研究员 Or Yair 最近公布了 Windows DOS 到 NT 路径转换过程中的一系列漏洞，这些漏洞可能允许攻击者在不需要管理权限的情况下获得类似 …

2024年4月25日
微软Microsoft

Microsoft 由于错误警报而暂时撤回 Outlook 安全更新

Microsoft 最近撤回了 Outlook 的安全更新，因为发现它在用户打开 ICS 日历文件时会导致不正确的安全警报。该问题是在 12 月针对 Outlook 桌面应用程序的…

2024年4月25日
工具软件

Microsoft 通过最新的修补程序更新解决了 Exchange Server 问题，并添加了 ECC、HMA 支持

Microsoft 宣布发布修补程序更新，旨在解决在安装 2024 年 3 月安全更新后影响 Exchange 服务器的几个问题。除了修复这些问题之外，2024 年 4 月修补程序…

2024年4月25日
已解决：帐户图片错误此图片无法保存

帐户头像错误。当您尝试在 Windows 上为用户帐户设置个人资料图片时，屏幕上出现此图片无法保存错误消息，任何人都可能发生此图片。除了基本身份识别外，设置个人资料图片还可以帮助…

2024年4月19日 • 工具软件
此连接不是iPhone中Safari上的私人错误：修复

在iPhone上通过Safari浏览网站时，您可能会遇到此错误提示“此连接不是私人的”消息。有很多可能的原因可以归咎于此。如果您按照以下步骤对 Safari 中的问题进行故障排除，…

2024年4月16日 • 苹果Apple
远程桌面无法验证远程计算机的身份：修复

远程桌面连接或 RDC 并非完全防错。有很多设置可能会影响远程桌面连接。连接到远程桌面系统时，可能会出现此错误消息“远程桌面无法验证远程计算机的身份”。通常，主机和远程设备之间的时…

2024年4月1日 • 工具软件
Excel Visual Basic中的运行时错误13类型不匹配：修复

在 Excel 电子表格中执行 Visual Basic 代码时，您可能会遇到以下“运行时错误 13.类型不匹配“提示。Visual Basic 应用程序模块可帮助您增强工作表。但…

2024年3月29日 • 工具软件
工具软件

Array.prototype.map（）期望从箭头函数：Fix 返回值

Javascript 中可能会弹出错误提示“Array.prototype.map（） expects a return value from Arrow Function”（Ar…

2024年3月28日
工具软件

20 种专为内容创作者设计的 AI 工具

20 种专为内容创作者设计的 AI 工具在快节奏的内容创作世界中，人工智能（AI）改变了游戏规则。它提供了大量的工具来简化创作过程，使您能够以更高的效率制作引人入胜的高质量内…

2024年3月28日
CcmSetup 失败，错误代码为 0x80004005 [已解决]

CcmSetup 失败，出现错误代码0x80004005尝试将更新推送到域中的客户端电脑时经常出现。它是由配置错误、缺少关键服务、防火墙阻止更新或无法访问 MP（管理点）或 DP（…

2024年3月20日 • 工具软件
什么是默认的 Windows 11 密码以及如何在没有密码的情况下登录

默认密码通常是设置或购买新设备时附带的通用预定义密码。Windows 11 没有默认密码，但如果您被锁定，有一些解决方法可以重新获得访问权限。如何在没有默认密码的情况下登录 Wi…

2024年3月20日 • Win 11
Win 11

如何在Windows中使用和配置Sudo

随着 Windows 11 Insider Preview Build 26052 的发布，Sudo 被引入 Windows 11，拥有此版本及更高版本的用户可以使用它来以管理员身…

2024年3月20日
修复：ERR_PROXY_CONNECTION_FAILED错误

许多用户报告说没有互联网连接。代理服务器有问题，或者地址不正确，并在尝试在其计算机上使用浏览器时出现ERR_PROXY_CONNECTION_FAILED错误。要修复此连接错误，您…

2024年3月20日 • 工具软件
找不到 BCryptHash：修复它的 7 种方法

我们最近遇到了McUICnt.exe 找不到入口点，在动态链接库中找不到过程入口点 BCryptHash bcrypt.dll在多个设备上出现错误，有些设备运行 Windows 7…

2024年3月20日 • Win 11
在 Windows 资源管理器中搜索特殊字符：2 种简单方法

虽然我们知道 Windows 不允许在文件名中使用特殊字符，但大多数人都不知道它也无法使用标准搜索字段方法进行本机搜索。那么，如何在Windows（文件）资源管理器中搜索特殊字符呢…

2024年3月20日 • Win 11
HtcVComV64.sys 内存完整性错误 [已解决]

虽然内核隔离或内存完整性有助于保护 PC，但启用它可能对许多人来说具有挑战性。至少我们是这样，Windows 安全中心将 HtcVComV64.sys 列为不兼容的驱动程序。在这…

2024年3月19日 • 工具软件
如何打开Windows上RBF文件

Windows 使用 RBF 文件格式在软件安装期间创建临时备份，允许操作系统在安装不成功时还原内容。您可以使用合适的程序轻松打开RBF文件。 RBF （.rbf）文件通常存储在…

2024年3月19日 • 工具软件
Win 11

XPW文件扩展名：如何在Windows上打开它

XPW文件扩展名在当今是罕见的，因为创建这些文件的程序，由Intercon Associates Inc.开发的Accessible FormNet，已经过时了。不过，如果您有一些…

2024年3月18日
Ssvagent.exe：它是什么以及如何禁用Java进程

许多用户报告说看到与ssvagent.exe相关的错误消息，或者它触发了 PC 上的高 CPU 或 RAM 使用率。过去，我们在 Internet Explorer 上看到ssva…

2024年3月18日 • 工具软件
Uplay_r164.dll 找不到或不受信任的系统文件 [已解决]

该uplay_r164.dll由育碧开发，并被多款 Ubisoft Connect 游戏使用，包括《刺客信条》、《孤岛惊魂 4》、《全境封锁 2》和《看门狗》等。与该文件相关的两…

2024年3月18日 • 工具软件
什么是inetcpl.cpl以及如何修复其错误

netcpl.cpl 或 Internet 属性是一个内置实用程序，允许用户配置与 Internet 相关的设置，包括安全、隐私、证书、VPN 和加载项。它存储在以下位置：C:\W…

2024年3月18日 • 工具软件
4 种将 exFAT 转换为 FAT32 格式的方法 Windows 11

将文件系统从 exFAT 转换为 FAT32 涉及更改存储设备的格式。我们向您展示了实现这一目标的各种方法。我可以将 exFAT 更改为 FAT32 吗？是的，您可以将 exFA…

2024年3月18日 • Win 11
AHCI Port0 设备错误 [已解决]

启动时出现 American Megatrends AHCI Port0 Device Error（美国大趋势 AHCI 端口 0 设备错误），表示硬盘驱动器出现故障或 SATA …

2024年3月18日 • 工具软件
工具软件

什么是SbPFSvc.exe以及如何删除它？

SbPFSvc exe（可执行文件）文件是Sunbelt Personal Firewall安装的一部分，由Sunbelt Software开发。它的程序文件夹还包含各种其他可执行…

2024年3月18日

Insanely Fast Whisper：98秒的时间内转录5小时

通过您的终端进行极快的转录！

项目链接

相关推荐