一张图片胜过千言万语。微软非常重视这句老话,它在 Edge 中引入了一项名为“自动图像描述”的新功能,以帮助有视力障碍的人。
在我们讨论这项技术是如何工作的之前,让我们先来看看网站是如何使用图像的。当博客发布文章时,作者会在帖子中附加屏幕截图,并为图像设置属性。该属性称为替代文本。此描述充当搜索引擎识别的标题或描述。当用户搜索适合图像替代文本的关键字时,搜索引擎将在结果中突出显示适当的图像。
Microsoft Edge 中的自动图像描述
Windows 10 和 11 中的“讲述人”等屏幕阅读器通常由有视觉障碍的人使用。这些软件使用文本到语音的算法来帮助他们理解屏幕上显示的内容,以及选择/执行各种选项等。
Microsoft Edge 支持讲述人阅读网页上的文本内容,并协助用户浏览网站、链接等。当浏览器加载包含图像的页面时,讲述人将检查图片是否分配了替代文本,并如果是,它将被大声朗读。
根据微软的说法,许多网站不包含图像的替代文本。这意味着他们的描述是空白的,屏幕阅读器会完全跳过它,用户将错过图片可能包含的有用信息。
这就是 Microsoft Edge 中新的自动图像描述发挥作用的地方。它结合了图像的光学识别和文本到语音的识别。当 Microsoft Edge 检测到图像没有替代文本标题时,它会将媒体发送到其机器学习算法,该算法由 Azure 认知服务的计算机视觉 API 提供支持。
人工智能技术分析图像中的内容,以一种受支持的语言为其创建描述,并将其返回给浏览器,供讲述人大声朗读。它还能够通过光学字符识别 (OCR) 检测图像中的文本,并支持 120 种语言。自动图像描述支持常见的图像格式,例如 JPEG、GIF、PNG、WebP 等等。
Vision API 将忽略一些例外情况,即不向读者大声朗读。这包括网站设置为描述性的图像、小于 50 x 50 像素的图像、非常大的图片以及可能包含血腥或成人内容的照片。
如何在 Microsoft Edge 中启用自动图像描述?
自动图像描述现在可用于 Windows、Linux 和 macOS 的 Microsoft Edge 稳定版本。该选项默认不启用,因为它有自己的隐私政策。要打开该选项,请转到 Edge 设置 >辅助功能页面,然后单击“从 Microsoft 获取屏幕阅读器的图像描述。”旁边的按钮,您需要接受隐私政策才能使用该功能。
使用热键 Ctrl + Win + Enter启用 Windows讲述人,屏幕阅读器将在您使用 Microsoft Edge 浏览 Internet 时为您读出图像描述。您可以从浏览器的上下文菜单中切换该功能。
原创文章,作者:校长,如若转载,请注明出处:https://www.yundongfang.com/Yun140113.html