使用 SmartGPT 框架让 ChatGPT 更加智能

2023年9月2日下午9:41 • 工具软件

新的框架正在帮助使ChatGPT等语言学习模型（LLM）更加智能，能够自主处理三个不同阶段的复杂任务。通过将任务分解为更小、更易于管理的问题，并利用来自互联网和其他外部来源的信息。这个被称为SmartGPT的框架正在彻底改变LLM的运作方式。

SmartLLMChains基于SmartGPT工作流程，是一种自我批评链的形式，如果有特别复杂的问题需要回答，可以帮助你。它不是执行单个LLM传递，而是执行以下3个步骤：

构思：通过LLM传递用户提示n次，得到n个输出提案（称为“想法”），其中n是可以设置的参数
批评：LLM批评所有想法以找到可能的缺陷并选择最好的一个
决心：LLM试图改进最佳想法（如在批评步骤中选择的那样）并输出它。这是最终输出。

这个快速概述深入探讨了SmartGPT框架在Langchain中的实际应用，以支持您自己的LLM应用程序。SmartGPT 的概念植根于 GPT 基础模型中自我批评或自我反思的实施，以提高生成答案的质量。

SmartGPT 和 LangChain

这个过程分三个阶段执行：构思、批评或自我反思以及解决。在构思阶段，LLM会在同一用户提示下多次提示，从而生成各种输出或想法。在批评阶段，LLM评估其产生的所有想法，查明潜在的缺陷，并选择最佳答案。在解决阶段，LLM努力增强其产生的最佳想法或答案，最终成为最终输出。

这种方法是思维链提示的延伸，可以显着提高LLM的输出，特别是对于需要逻辑推理的提示或问题。Langchain整合了一个新的链，智能LLM链，可以在工作流程中使用。

更高的加工成本

但是，值得注意的是，与使用普通提示相比，使用智能LLM链将导致更多的传递，因此成本更高。为了使智能LLM链有效运行，底层LLM需要具有自反射能力，并且能够仅返回单个输出。

SmartGPT的想法是由AI Explained提出的，SmartGPT 是一个框架，包括 LLM 对其生成的响应的自我反思或批评，以逐步思考并在向用户展示之前评估其答案。

SmartGPT – 主要基准被打破 – MMLU 上的 89.0%

“使用 SmartGPT 系统的 GPT4 是否以多种方式打破了主要基准 MMLU？89.0% 是一个非官方记录，但我们是否迫切需要一个新的权威基准，特别是考虑到今天的内幕消息，双子座的计算量是 GPT 5 的 5 倍？

SmartLLMChain可以集成到代码项目中，在上面的第一个视频中使用Langchain的代码提供了详细的分步过程。此过程涉及导入必要的包、设置提示模板、定义 LLM 链和运行链。智能LLM链可以配置LLM，提示和要生成的想法数量。

LLM产生不同的想法，批评它们，然后在解决阶段完善最佳答案。不同的LLM可用于不同的步骤，较高温度的LLM用于构思阶段，以获得更多响应的变化，而较低温度的LLM用于批评和解决阶段。

SmartLLMChain的独特之处在于其创新框架，该框架结合了LLM对其生成的响应的自我反思或批评。这种内省的方法使LLM能够逐步思考并在向用户展示答案之前对其进行评估。事实证明，这种技术可以显着提高LLM在MMLU等基准上的表现。

SmartLLMChain是一种技术，迫使LLM在生成最终答案之前对其答案进行自我反思，从而可能提高某些用例的性能。这种创新方法将重新定义人工智能和语言学习模式的格局。

原创文章，作者：校长，如若转载，请注明出处：https://www.yundongfang.com/Yun251860.html

LLM 批评框架

打赏

微信扫一扫不于多少！

支付宝扫一扫礼轻情意重

如何使用谷歌Bard更具创造力

上一篇 2023年9月2日

如何强制重启安卓手机

下一篇 2023年9月2日

Jan：本地LLM聊天软件

Jan：本地LLM聊天软件一个全平台的本地 LLM 聊天软件Jan，支持自动下载模型以及非常详细的设置。懒得配置 Ollama 的可以试试。除了支持本地模型以外，在线的模型可…

工具软件 2024年5月10日
Opera 成为第一个集成本地 AI 模型的主要浏览器

Opera 正在将对 150 种本地 LLM（大型语言模型）变体的支持集成到 Opera One（该公司的 AI 集成浏览器）的开发人员流中。添加对 AI 的实验性本地支持是浏览器…

2024年4月6日 • 工具软件
AnyV2V：适用于任何视频到视频编辑任务的即插即用框架

AnyV2V：适用于任何视频到视频编辑任务的即插即用框架 AnyV2V框架的介绍： AnyV2V是一个新颖的训练免费框架，旨在简化视频编辑任务。它将视频编辑分解为两个主要步骤：首先…

工具软件 2024年3月26日
工具软件

提升本地 AI 大型语言模型（LLM）的智能

提升本地 AI 大型语言模型（LLM）的智能在快速发展的自然语言处理领域，出现了一种新的方法来提高大型语言模型（LLM）的本地AI性能、智能和响应准确性。通过将代码分析和执行…

2024年3月17日
工具软件

什么是LangChain，如何使用它？

什么是LangChain，如何使用它？如果您一直在寻找可以使您的工作更顺畅、项目更令人印象深刻的工具。您可能听说过围绕大型语言模型（LLM）的嗡嗡声，以及它们改变我们与技术交…

2024年3月15日
工具软件

Notdiamond-0001：自动选择LLM模型

Notdiamond-0001：自动选择LLM模型 Notdiamond-0001这个项目可以自动帮你选择将用户的问题发送给GPT-4还是GPT-3.5，从而大幅降低调用模型的成本…

2023年12月19日
工具软件

LLM Visualization

LLM Visualization 这个 LLM 算法的可视化演示太强了，之前我们看到的都是 2D 的，这个是 3D 的。而且他完整的展示了整个 LLM不同模块内部的运作机制和各模…

2023年12月19日
苹果Apple

M3 Pro AI 跑分成绩超越 Nvidia RTX 4090

苹果于12月6日宣布推出MLX，一款专为Apple Silicon设计的开源框架。这款框架的目标是让 AI 开发者能在其项目中进行构建、测试、使用及优化。基准测试中表现出色开…

2023年12月14日
工具软件

大型语言模型简介：它们是什么以及它们如何工作？

大型语言模型（LLM）已成为不断发展的技术世界中的一项革命性发展。大型语言模型具有多种应用，从自动完成句子等简单任务到翻译语言、生成创意内容，甚至参与类似人类的对话等复杂任务。…

2023年12月5日
工具软件

LLM AI 代理是什么，如何使用它们？

由大型语言模型（LLM）提供支持的 LLM AI 代理代表了人工智能领域的一个新领域。这些系统利用LLM的能力来推理问题，制定解决问题的计划，并在执行过程中出现不可预见的问题时…

2023年12月1日
工具软件

开源大型语言模型与专有（LLM）的优势

随着 Huggingface 上可用的大型语言模型（LLM）数量的增加，关注专有模型和开源模型之间的区别对于 AI 爱好者和企业理解至关重要。专有 LLM 由有使用限制的公司…

2023年11月28日
最新资讯

新推出的 LLM Inflection-2 声称其性能优于谷歌的旗舰 PaLM 2，仅次于 GPT4

Inflection AI 宣布发布 Inflection-2，这是一种新的大型语言模型（LLM），是当今世界上仅次于 OpenAI 的 GPT4 的第二大 LLM。什么是LL…

2023年11月23日
Matryoshka Diffusion Models

Matryoshka Diffusion Models 提出了一种端到端的高分辨率图像和视频合成框架。所提出的框架使用扩散过程，可联合对多个分辨率的输入进行去噪，并使用嵌套的UNe…

工具软件 2023年10月30日
工具软件

催眠 AI 以使用自然语言绕过现有规则或 LLM 安全性

大型语言模型（LLM）在过去几年中呈爆炸式增长，但它们的安全性如何，它们的响应能否纵？IBM 仔细研究了大型语言模型带来的潜在安全风险，以及可能出于恶意原因操纵它们的策略。大型语…

2023年10月30日
工具软件

使用 AutoGen 和 GPT-4 构建虚拟 AI 员工队伍

新的Microsoft AutoGen框架创建的大量项目，该框架已悄悄地推广到GitHub。提供一个框架，支持使用多个代理开发LLM应用程序，能够相互通信以解决任务。AutoGen…

2023年10月24日
Llemma：数学 LLM

Llemma：数学 LLM 开源 LLM，用于在最多 200B 个数学文本标记上进行训练的数学LLM。Llemma 34B 的性能接近 Google 的 Minerva 62B，…

工具软件 2023年10月23日
将 LLM 当做操作系统

将 LLM 当做操作系统大型语言模型（LLM）在扩展对话和文档分析等任务中存在上下文窗口有限的局限性。为了解决这个问题，作者提出了虚拟上下文管理，这是一种受传统操作系统的分层存储…

工具软件 2023年10月23日
如何用语音和LLM交谈

如何用语音和LLM交谈文章讨论了使用大型语言模型（LLM）构建语音驱动的人工智能应用。作者解释了构建 LLM 应用程序所需的三个基本组件：语音到文本、文本到语音和 LLM 本身。…

工具软件 2023年10月23日
工具软件

MemGPT 将 LLM 转换为操作系统

不可否认，大型语言模型（LLM）的出现彻底改变了人工智能领域。但是，这些模型并非没有局限性。他们面临的最重大挑战之一是有限的上下文窗口的限制。此限制妨碍了它们在扩展对话和文档分析等…

2023年10月17日
大型语言模型入门：需要了解的关键事项

大型语言模型入门：需要了解的关键事项大型语言模型（LLM）是在大型数据集上训练的模型，用于理解和生成内容。LLM利用transformer模型，具有位置编码和自注意力的重要特性。…

工具软件 2023年10月16日
工具软件

Deasie：LLM数据服务

Deasie：LLM数据服务这是一家为LLM应用提供数据治理的公司。他们的服务包括检测敏感信息、确定数据的上下文和含义、为文档分配质量分数以及创建认证数据目录。

2023年10月16日
微软Microsoft

建立自己的 AI 代理员工队伍 – 分步教程

建立自己的虚拟助手或 AI 代理的 AI 劳动力比您想象的要容易得多。如果您的计算机运行超过 8 GB 的 RAM，您可以在几分钟内使用 Ollama 轻松安装您自己的个人 AI。…

2023年10月14日
工具软件

如何构建会思考的 AI 模型

如果您有兴趣了解有关如何构建思考人工智能AI模型的更多信息，您可能会发现4IR与David Shapiro一起创建的快速概述指南和视频非常有用。自主认知实体（ACE）框架是一种…

2023年10月12日
工具软件

如何构建会思考的 AI 模型

如果您有兴趣了解有关如何构建思考人工智能AI模型的更多信息，您可能会发现4IR与David Shapiro一起创建的快速概述指南和视频非常有用。自主认知实体（ACE）框架是一种…

2023年10月9日
工具软件

使用 Autogen AI 代理框架完全自动化内容创建

最近，Microsoft非常悄悄地向GitHub发布了一个新的多AI代理框架，以Autogen的形式。为任何感兴趣的人提供一种非常轻松地创建自定义 AI 代理工作流的方法。例如能够…

2023年10月5日

使用 SmartGPT 框架让 ChatGPT 更加智能

SmartGPT 和 LangChain

更高的加工成本

SmartGPT – 主要基准被打破 – MMLU 上的 89.0%

相关推荐