ChatGPT 视觉和 AI 艺术生成测试

2023年10月3日下午7:44 • 微软Microsoft

OpenAI最近在ChatGPT中引入了新的语音和图像功能，这是人工智能领域向前迈出的一大步。我强烈建议您查看我遇到的关于这种新的ChatGPT 4 Vision技术如何用于各种应用的第一个示例。例如，只需绘制所需程序的流程图，ChatGPT 将编写代码以使其成为现实

这些新的 ChatGPT Vision 功能使用户能够进行语音对话并向 AI 显示图像，从而扩展了 ChatGPT 在日常生活中的使用方式。从识别地标到根据食品储藏室内容建议食谱，或协助解决数学问题，可能性是巨大的，几乎是无穷无尽的。

这些语音和图像功能的推出将在未来两周内提供给ChatGPT Plus和企业用户。语音将在iOS和Android上提供，而图像将在所有平台上提供。这种功能的扩展证明了OpenAI致力于使AI更易于访问和有用。

聊天语音

ChatGPT 中的语音功能由新的文本转语音模型提供支持，该模型从文本和示例语音生成类似人类的音频。此功能是与专业配音演员合作开发的，并使用OpenAI的开源语音识别系统Whisper将口语转录为文本。与Spotify在语音翻译功能方面的合作是如何将AI集成到日常应用程序中的一个主要例子。

另一方面，图像理解由多模态 GPT-3.5 和 GPT-4 提供支持。这些模型将语言推理技能应用于各种图像，包括照片、屏幕截图以及包含文本和图像的文档。此功能允许 ChatGPT 识别图像中的特定元素，包括人和物体，甚至可以从屏幕截图中为软件即服务仪表板编写代码，如 AI 开发人员 McKay Wrigley 所示。

ChatGPT Vision

这些语音和图像技术的引入并非没有潜在的风险和挑战。新的语音技术存在潜在的风险，例如冒充或欺诈，因此其使用仅限于语音聊天等特定应用程序。基于视觉的模型也带来了挑战，例如幻觉或高风险的解释。为了降低这些风险，OpenAI在部署之前进行了广泛的测试和风险评估。

OpenAI还与盲人和低视力人群的应用程序Be My Eyes合作，以了解基于视觉的模型的用途和局限性。这种合作帮助OpenAI制定了技术措施，以限制ChatGPT分析和直接陈述人的能力，以尊重个人隐私。

尽管有这些令人印象深刻的功能，但重要的是要注意人工智能技术仍然存在局限性。例如，ChatGPT未能通过智商测试，这表明其读取自己的响应和推断反向逻辑的能力存在局限性。然而，人工智能技术的快速发展是有希望的，在软件开发和用户测试方面有潜在的应用。

OpenAI在ChatGPT中引入语音和图像功能是AI领域的重大进步。虽然这些技术存在潜在的风险和挑战，但OpenAI致力于构建安全和有益的AGI，加上严格的测试和风险评估，确保这些工具将继续得到完善和改进。随着人工智能的不断发展，它无疑将成为我们日常生活中更加不可或缺的一部分。

原创文章，作者：校长，如若转载，请注明出处：https://www.yundongfang.com/Yun259478.html

打赏

微信扫一扫不于多少！

支付宝扫一扫礼轻情意重

通过 PowerShell 在 Windows 11 或 10 上安装 Docker Desktop

上一篇 2023年10月2日下午6:35

您现在可以通过必应聊天免费访问 DALL-E 3 型号，并 Bing.com/create

下一篇 2023年10月5日下午1:55

ChatGPT Search什么时候可以免费使用？

未来数月内将向免费用户全面开放 ChatGPT Search 已全面上线所有 ChatGPT 现有接口，包括 chatgpt.com 官网，以及桌面和移动应用程序。不过，目前仅限…

最新资讯 2024年11月3日
ChatGPT Search 亮点有哪些？

ChatGPT Search 亮点有哪些？根据 GhatGPT 整理，ChatGPT 的搜索功能能够更灵活地响应复杂且时效性强的查询需求，具备五大亮点：即时性数据：搜索功能允许…

最新资讯 2024年11月3日
OpenAI o1 是什么？如何运作的

https://u.jd.com/daBByyr https://u.jd.com/d67YrPi OpenAI o1 可以通过复杂的任务进行推理，并解决比以前的科学、编码和数学模…

工具软件 2024年9月20日
这就是为什么大多数人还没有进入人工智能的原因

人工智能是一个加载的术语。对一些人来说，它象征着未来的道路;对其他人来说，这是一种颠覆性的技术，可以让他们摆脱工作。尽管仍处于早期阶段，但大型科技公司正在对聊天机器人和虚拟助手等支…

工具软件 2024年6月16日
什么是Ask Photos，它是如何工作的？

您的智能手机上有一个蓬勃发展的画廊？找不到你要找的东西？Google 相册上新的“询问照片”功能将很快让您的生活更轻松。在 Google I/O 2024 期间宣布的 Ask P…

工具软件 2024年5月31日
如何在您的 Nothing 手机上使用 ChatGPT 快捷方式

ChatGPT 已经可以通过其官方应用程序在智能手机上访问。但是，如果您有 Nothing Phone，则可以使用一些额外的 ChatGPT 集成，这些集成可以加快常规的 Chat…

2024年5月28日 • 技术教程
Win 11

如何在 Windows 11 上禁用召回 AI 功能

随着 Microsoft 继续深入研究 AI，将继续推出更多像 Recall 这样的功能，但对于可能觉得这些功能变得有些侵入性的用户，您可以在 Windows 11 上禁用它们。 …

2024年5月23日
您必须了解的 3 大 Android 15 功能

随着 beta 2 的发布，Android 15 越来越接近完整版本。虽然它与 Android 14 没有太大区别，但它有几个新的和急需的功能，可以更新和改进标准的 Android…

工具软件 2024年5月23日
工具软件

FeaturesVote：利用用户反馈帮助增长

FeaturesVote：利用用户反馈帮助增长 FeaturesVote 是一个帮助企业通过用户反馈来驱动产品增长的工具。其主要功能包括：用户投票板：用户可以发布和投票他们希望看…

2024年5月20日
ChatGPT产品层面的更新

ChatGPT产品层面的更新新的 ChatGPT 更新，支持利用 GPT-4o 进行实时的语音和视频对话。网页端和移动端全新的 UI 设计。发布 Mac 版本的 ChatGP…

工具软件 2024年5月20日
Indigo关于发布会预测的整理

Indigo关于发布会预测的整理 GPT-4 的新版应该会按照参数规模不同分化成多个版本，这个和 Claude 还有 Gemini 多版本的逻辑一样；前两周出现在 llmsys …

工具软件 2024年5月20日
工具软件

Claude推出移动应用以及团队版计划

Claude推出移动应用以及团队版计划 Anthropic的商业化进度开始加速，这周先是推出了 Claude 的 iOS 应用，然后又推出了团队计划开始赚 2B 的钱。 iOS 应…

2024年5月10日
如何在 Android 上编辑 ChatGPT 提示

ChatGPT 的网络版本在与 AI 机器人聊天时提供了全方位的选项。但是在智能手机上使用它要方便得多，这就是为什么它的智能手机应用程序一直在快速追赶。ChatGPT 的 Andr…

2024年5月3日 • 工具软件
工具软件

OpenAI 让您无需注册即可使用 ChatGPT

OpenAI 正在消除使用 ChatGPT 的所有障碍，甚至不需要注册。该公司周一宣布，它允许用户无需注册即可开始使用聊天机器人。这里的目的是“让任何对人工智能能力感到好奇的人都能…

2024年4月6日
2024 年添加到 MS Excel 的所有新功能（到目前为止）

Microsoft定期向MS Excel添加新功能。无论是 Web、Windows、Mac 还是 iPad，这些更新对于在快速发展的科技世界中保持这一最重要的 Office 工具的…

2024年4月2日 • 工具软件
Win 11

Windows 11 将拖放功能恢复到文件资源管理器的地址栏

在 Windows 11 23H2 中删除它后，Microsoft 恢复了从文件资源管理器的地址栏本身拖放文件的功能。使用此功能，用户可以将文件从当前文件夹移动到地址栏路径中的上…

2024年4月2日
工具软件

Galaxy S25 可能会获得更快的存储空间，以实现 AI 驱动的功能

将人工智能驱动的功能集成到设备本身似乎是大多数手机制造商押注的道路。虽然它主要是为高端手机保留的，但设备仍然必须具有可以服务于AI功能的硬件功能。大多数用于人工智能的高端硬件功能都…

2024年4月2日
三星 Galaxy S22 也可能获得 AI 的好处！

众所周知，三星计划为其更高端的设备带来一系列 AI 功能，其中包括 Galaxy S23 系列、Galaxy Z Fold 5 和 Z Flip 5 以及 Galaxy Tab S…

最新资讯 2024年4月2日
苹果Apple

您可能不知道的 10 个隐藏的 iPhone 功能

您可能不知道的 10 个隐藏的 iPhone 功能在本文中，我们有一个来自 Proper Honest Tech 的精彩视频，向我们展示了您可能不知道的一系列 iPhone 功能…

2024年3月28日
Microsoft在未来几天内最终确定 Windows 11 24H2 RTM 候选者

Windows 11 24H2 可能会在几周内达到 RTM（向制造商发布）状态。这意味着Microsoft将开始向 PC 制造商提供更新，允许三星、联想或惠普等 OEM 在其即将推…

2024年3月26日 • 微软Microsoft
工具软件

如何编写 ChatGPT 提示以改善您的业务工作流程

如何编写 ChatGPT 提示以改善您的业务工作流程如果您经营一家小型企业，并且正在寻找利用人工智能（AI）来帮助您使工作流程和运营更顺畅、更高效的方法。本快速指南将为您提供…

2024年3月26日
工具软件

Copilot Pro GPT 与 ChatGPT Plus GPT 深入比较指南

Copilot Pro GPT 与 ChatGPT Plus GPT 深入比较指南如果您有兴趣了解更多关于两种主要 AI 模型提供的差异：Microsoft Copilot Pr…

2024年3月26日
工具软件

新的 OpenAI 语音引擎项目

新的 OpenAI 语音引擎项目据报道，OpenAI正在开发一个新的语音引擎项目，该项目已通过最近的“语音引擎”商标申请得到暗示。该商标表明该项目可能涉及语音和语音识别、处理命令…

2024年3月26日
苹果Apple

20 iPhone 15 和 15 Pro 相机提示和技巧

20 iPhone 15 和 15 Pro 相机提示和技巧 iPhone 15 系列再次提升了移动摄影和摄像的标准，其先进的相机功能有望将每个用户转变为熟练的内容创作者。无论你是经…

2024年3月26日
工具软件

Creatie：主打AI功能的UI设计软件

Creatie：主打AI功能的UI设计软件我去 Creatie 这个 AI UI 设计工具有点强啊，做的相当完整，基本上可以当做一个加上了 AI 功能的 FIgma。而且全部都…

2024年3月26日

ChatGPT 视觉和 AI 艺术生成测试

聊天语音

ChatGPT Vision

相关推荐