了解我们在网上看到和听到的来源
我们正在推出新工具来帮助研究人员研究内容真实性,并加入了内容来源和真实性联盟指导委员会。
世界各地的人们都在拥抱生成式 AI,以增强创造力、生产力和学习的方式创建和编辑图像、视频和音频。随着生成的视听内容变得越来越普遍,我们相信,对于整个社会来说,采用新的技术和标准将变得越来越重要,这些技术和标准可以帮助人们了解用于创建他们在网上找到的内容的工具。
在 OpenAI,我们通过两种方式应对这一挑战:首先,通过与他人合作采用、开发和推广一个开放标准,该标准可以帮助人们验证用于创建或编辑多种数字内容的工具,其次,通过创建新技术,专门帮助人们识别由我们自己的工具创建的内容。
为真实性标准做出贡献
世界需要共同的方式来分享有关数字内容如何创建的信息。标准可以帮助澄清内容是如何制作的,并以一种在许多情况下易于识别的方式提供有关其来源的其他信息——无论这些内容是来自相机的原始输出,还是来自DALL·E 3.
今天,OpenAI 加入了 C2PA 的指导委员会——内容来源和真实性联盟。C2PA 是一种广泛使用的数字内容认证标准,由软件公司、相机制造商和在线平台等众多参与者开发和采用。C2PA可用于证明内容来自特定来源。1我们期待为该标准的制定做出贡献,并将其视为我们方法的一个重要方面。
今年早些时候,我们开始将 C2PA 元数据添加到由 DALL·E 3,我们最新的图像模型,在 ChatGPT 和 OpenAI API 中。当视频生成模型 Sora 广泛推出时,我们将集成该模型的 C2PA 元数据。
如果没有这些信息,人们仍然可以创建欺骗性内容(或可以删除它),但他们不能轻易伪造或更改这些信息,使其成为建立信任的重要资源。随着标准采用率的提高,这些信息可以伴随内容的共享、修改和重用的整个生命周期。随着时间的流逝,我们相信这种元数据将成为人们所期望的,填补数字内容真实性实践的关键空白。
为了推动对来源标准(包括 C2PA)的采用和理解,我们正在加入 Microsoft启动社会复原力基金(在新窗口中打开).这笔 200 万美元的基金将支持人工智能教育和理解,包括通过以下组织AARP 的老年人技术服务(在新窗口中打开),国际IDEA(在新窗口中打开)和人工智能伙伴关系(在新窗口中打开).
我们正在构建的内容:用于识别我们服务创建的内容的新工具
除了对C2PA的投资外,OpenAI还在开发新的出处方法,以增强数字内容的完整性。这包括实施防篡改水印——用难以去除的不可见信号标记音频等数字内容——以及检测分类器——使用人工智能来评估内容源自生成模型的可能性的工具。这些工具旨在更能抵制删除有关内容来源的信号的尝试。
从今天开始,我们将向第一批测试人员(包括研究实验室和以研究为导向的新闻非营利组织)开放访问 OpenAI 图像检测分类器的应用程序,以通过我们的研究人员访问计划(在新窗口中打开).该工具预测图像由 OpenAI 的 DALL·E 3.我们的目标是实现独立研究,以评估分类器的有效性,分析其实际应用,揭示此类使用的相关考虑因素,并探索人工智能生成内容的特征。可以提交访问申请这里(在新窗口中打开).
了解分类器在何时何地可能表现不佳对于根据其结果做出决策的人来说至关重要。对早期版本分类器的内部测试表明,在区分非 AI 生成的图像和 DALL·E 3 产品。分类器正确识别 DALL·E 3 并且不会触发非 AI 生成的图像。它正确识别了 ~98% 的 DALL·E 3 张图像和不到 ~0.5% 的非 AI 生成图像被错误地标记为来自 DALL·E 3.分类器处理常见的修改,如压缩、裁剪和饱和度更改,对其性能的影响最小。但是,其他修改可能会降低性能。我们还发现,分类器用于区分DALL·E 3 和其他 AI 模型较低,分类器目前在我们的内部数据集上标记了其他 AI 模型生成的 ~5-10% 的图像。
此外,我们还将音频水印整合到我们的自定义语音模型 Voice Engine 中,该模型目前处于有限的研究预览阶段。我们致力于继续在这些领域进行研究,以确保我们在音频技术方面的进步同样透明和安全。
内容身份验证的下一步是什么
虽然上述技术解决方案为我们提供了积极的防御工具,但在实践中有效实现内容真实性将需要集体行动。例如,平台、内容创建者和中间处理程序需要促进保留元数据,以便为最终内容使用者提供关于内容来源的透明度。
我们在原产地方面的努力只是更广泛的行业努力的一部分——我们的许多同行研究实验室和生成式人工智能公司也在推进这一领域的研究。我们赞扬这些努力——行业必须合作并分享见解,以增强我们的理解并继续提高在线透明度。
原创文章,作者:校长,如若转载,请注明出处:https://www.yundongfang.com/Yun295524.html