阿里云今天升级了旗下通义听悟 AI 工具,上线了“提取 PPT、浏览器插件、小程序扩展”三大功能,官方宣称,“这些功能能够帮助用户在 PC 和移动端随时随地听懂、理解、阅读各类音视频内容,提升职场人士和学生的工作学习效率。”
▲ 图源 阿里云官方公众号
通义听悟此次升级,在原有“实时记录、音视频文件转写、全文概要、章节速览”等功能之上,新增“提取 PPT”功能。该功能通过引入视觉 AI 算法,能够“自动将 PPT 讲解视频分割为演示文稿”,并对每页 PPT 进行要点总结,形成一份图文并茂的大纲,能够“解决培训、网课学习等场景‘求 PPT 难’的问题”。
▲ 图源 阿里云官方公众号
通义听悟还增加了浏览器插件和移动端的支持。用户可以在 Chrome 内核的浏览器上安装插件,在开会、上网课、看直播、看视频时,能够调用插件进行全程录制,并实时生成双语字幕,从而“帮助用户更轻松地浏览视频内容”。
▲ 图源 阿里云官方公众号
阿里云同时为通义听悟带来了小程序扩展,据悉,通义听悟钉钉和微信小程序在支持 PC 端基础功能的同时,还可以一键转写手机和聊天记录的音视频文件,仅需一部手机即可记录、回顾和整理音视频内容。
通义听悟产品及研发负责人鄢志杰表示:“继语音 AI 与大语言模型碰撞出火花后,我们持续将视觉 AI 引入通义听悟这一创新产品,围绕人们工作和学习中的音视频内容,希望通过全新的体验成为大家的 AI 助手。”
原创文章,作者:校长,如若转载,请注明出处:https://www.yundongfang.com/Yun246645.html