使用 SmartGPT 框架让 ChatGPT 更加智能

新的框架正在帮助使ChatGPT等语言学习模型(LLM)更加智能,能够自主处理三个不同阶段的复杂任务。通过将任务分解为更小、更易于管理的问题,并利用来自互联网和其他外部来源的信息。这个被称为SmartGPT的框架正在彻底改变LLM的运作方式。

SmartLLMChains基于SmartGPT工作流程,是一种自我批评链的形式,如果有特别复杂的问题需要回答,可以帮助你。它不是执行单个LLM传递,而是执行以下3个步骤:

  1. 构思:通过LLM传递用户提示n次,得到n个输出提案(称为“想法”),其中n是可以设置的参数
  2. 批评:LLM批评所有想法以找到可能的缺陷并选择最好的一个
  3. 决心:LLM试图改进最佳想法(如在批评步骤中选择的那样)并输出它。这是最终输出。

这个快速概述深入探讨了SmartGPT框架在Langchain中的实际应用,以支持您自己的LLM应用程序。SmartGPT 的概念植根于 GPT 基础模型中自我批评或自我反思的实施,以提高生成答案的质量。

SmartGPT 和 LangChain

这个过程分三个阶段执行:构思、批评或自我反思以及解决。在构思阶段,LLM会在同一用户提示下多次提示,从而生成各种输出或想法。在批评阶段,LLM评估其产生的所有想法,查明潜在的缺陷,并选择最佳答案。在解决阶段,LLM努力增强其产生的最佳想法或答案,最终成为最终输出。

这种方法是思维链提示的延伸,可以显着提高LLM的输出,特别是对于需要逻辑推理的提示或问题。Langchain整合了一个新的链,智能LLM链,可以在工作流程中使用。

更高的加工成本

但是,值得注意的是,与使用普通提示相比,使用智能LLM链将导致更多的传递,因此成本更高。为了使智能LLM链有效运行,底层LLM需要具有自反射能力,并且能够仅返回单个输出。

SmartGPT的想法是由AI Explained提出的,SmartGPT 是一个框架,包括 LLM 对其生成的响应的自我反思或批评,以逐步思考并在向用户展示之前评估其答案。

SmartGPT – 主要基准被打破 – MMLU 上的 89.0%

“使用 SmartGPT 系统的 GPT4 是否以多种方式打破了主要基准 MMLU?89.0% 是一个非官方记录,但我们是否迫切需要一个新的权威基准,特别是考虑到今天的内幕消息,双子座的计算量是 GPT 5 的 5 倍?

SmartLLMChain可以集成到代码项目中,在上面的第一个视频中使用Langchain的代码提供了详细的分步过程。此过程涉及导入必要的包、设置提示模板、定义 LLM 链和运行链。智能LLM链可以配置LLM,提示和要生成的想法数量。

LLM产生不同的想法,批评它们,然后在解决阶段完善最佳答案。不同的LLM可用于不同的步骤,较高温度的LLM用于构思阶段,以获得更多响应的变化,而较低温度的LLM用于批评和解决阶段。

SmartLLMChain的独特之处在于其创新框架,该框架结合了LLM对其生成的响应的自我反思或批评。这种内省的方法使LLM能够逐步思考并在向用户展示答案之前对其进行评估。事实证明,这种技术可以显着提高LLM在MMLU等基准上的表现。

SmartLLMChain是一种技术,迫使LLM在生成最终答案之前对其答案进行自我反思,从而可能提高某些用例的性能。这种创新方法将重新定义人工智能和语言学习模式的格局。

原创文章,作者:校长,如若转载,请注明出处:https://www.yundongfang.com/Yun251860.html

(0)
打赏 微信扫一扫不于多少! 微信扫一扫不于多少! 支付宝扫一扫礼轻情意重 支付宝扫一扫礼轻情意重
上一篇 2023年9月2日
下一篇 2023年9月2日

相关推荐

  • Jan: 本地LLM聊天软件

    Jan: 本地LLM聊天软件 一个全平台的本地 LLM 聊天软件Jan,支持自动下载模型以及非常详细的设置。懒得配置 Ollama 的可以试试。 除了支持本地模型以外,在线的模型可…

    工具软件 2024年5月10日
  • Opera 成为第一个集成本地 AI 模型的主要浏览器

    Opera 正在将对 150 种本地 LLM(大型语言模型)变体的支持集成到 Opera One(该公司的 AI 集成浏览器)的开发人员流中。添加对 AI 的实验性本地支持是浏览器…

    2024年4月6日 工具软件
  • AnyV2V:适用于任何视频到视频编辑任务的即插即用框架

    AnyV2V:适用于任何视频到视频编辑任务的即插即用框架 AnyV2V框架的介绍: AnyV2V是一个新颖的训练免费框架,旨在简化视频编辑任务。它将视频编辑分解为两个主要步骤:首先…

    工具软件 2024年3月26日
  • 提升本地 AI 大型语言模型 (LLM) 的智能

    提升本地 AI 大型语言模型 (LLM) 的智能 在快速发展的自然语言处理领域,出现了一种新的方法来提高大型语言模型(LLM)的本地AI性能、智能和响应准确性。通过将代码分析和执行…

    2024年3月17日
  • 什么是LangChain,如何使用它?

    什么是LangChain,如何使用它? 如果您一直在寻找可以使您的工作更顺畅、项目更令人印象深刻的工具。您可能听说过围绕大型语言模型 (LLM) 的嗡嗡声,以及它们改变我们与技术交…

    2024年3月15日
  • Notdiamond-0001:自动选择LLM模型

    Notdiamond-0001:自动选择LLM模型 Notdiamond-0001这个项目可以自动帮你选择将用户的问题发送给GPT-4还是GPT-3.5,从而大幅降低调用模型的成本…

    2023年12月19日
  • LLM Visualization

    LLM Visualization 这个 LLM 算法的可视化演示太强了,之前我们看到的都是 2D 的,这个是 3D 的。而且他完整的展示了整个 LLM不同模块内部的运作机制和各模…

    2023年12月19日
  • M3 Pro AI 跑分成绩超越 Nvidia RTX 4090

    苹果于12月6日宣布推出MLX,一款专为Apple Silicon设计的开源框架。 这款框架的目标是让 AI 开发者能在其项目中进行构建、测试、使用及优化。 基准测试中表现出色 开…

    2023年12月14日
  • 大型语言模型简介:它们是什么以及它们如何工作?

    大型语言模型 (LLM) 已成为不断发展的技术世界中的一项革命性发展。大型语言模型具有多种应用,从自动完成句子等简单任务到翻译语言、生成创意内容,甚至参与类似人类的对话等复杂任务。…

    2023年12月5日
  • LLM AI 代理是什么,如何使用它们?

    由大型语言模型 (LLM) 提供支持的 LLM AI 代理代表了人工智能领域的一个新领域。这些系统利用LLM的能力来推理问题,制定解决问题的计划,并在执行过程中出现不可预见的问题时…

    2023年12月1日
  • 开源大型语言模型与专有 (LLM) 的优势

    随着 Huggingface 上可用的大型语言模型 (LLM) 数量的增加,关注专有模型和开源模型之间的区别对于 AI 爱好者和企业理解至关重要。 专有 LLM 由有使用限制的公司…

    2023年11月28日
  • 新推出的 LLM Inflection-2 声称其性能优于谷歌的旗舰 PaLM 2,仅次于 GPT4

    Inflection AI 宣布发布 Inflection-2,这是一种新的大型语言模型 (LLM),是当今世界上仅次于 OpenAI 的 GPT4 的第二大 LLM。 什么是LL…

    2023年11月23日
  • Matryoshka Diffusion Models

    Matryoshka Diffusion Models 提出了一种端到端的高分辨率图像和视频合成框架。所提出的框架使用扩散过程,可联合对多个分辨率的输入进行去噪,并使用嵌套的UNe…

    工具软件 2023年10月30日
  • 催眠 AI 以使用自然语言绕过现有规则或 LLM 安全性

    大型语言模型(LLM)在过去几年中呈爆炸式增长,但它们的安全性如何,它们的响应能否纵?IBM 仔细研究了大型语言模型带来的潜在安全风险,以及可能出于恶意原因操纵它们的策略。 大型语…

    2023年10月30日
  • 使用 AutoGen 和 GPT-4 构建虚拟 AI 员工队伍

    新的Microsoft AutoGen框架创建的大量项目,该框架已悄悄地推广到GitHub。提供一个框架,支持使用多个代理开发LLM应用程序,能够相互通信以解决任务。AutoGen…

    2023年10月24日
  • Llemma: 数学 LLM

    Llemma: 数学 LLM 开源 LLM,用于在最多 200B 个数学文本标记上进行训练的数学LLM。Llemma 34B 的性能接近 Google 的 Minerva 62B,…

    工具软件 2023年10月23日
  • 将 LLM 当做操作系统

    将 LLM 当做操作系统 大型语言模型(LLM)在扩展对话和文档分析等任务中存在上下文窗口有限的局限性。为了解决这个问题,作者提出了虚拟上下文管理,这是一种受传统操作系统的分层存储…

    工具软件 2023年10月23日
  • 如何用语音和LLM交谈

    如何用语音和LLM交谈 文章讨论了使用大型语言模型(LLM)构建语音驱动的人工智能应用。作者解释了构建 LLM 应用程序所需的三个基本组件:语音到文本、文本到语音和 LLM 本身。…

    工具软件 2023年10月23日
  • MemGPT 将 LLM 转换为操作系统

    不可否认,大型语言模型(LLM)的出现彻底改变了人工智能领域。但是,这些模型并非没有局限性。他们面临的最重大挑战之一是有限的上下文窗口的限制。此限制妨碍了它们在扩展对话和文档分析等…

    2023年10月17日
  • 大型语言模型入门:需要了解的关键事项

    大型语言模型入门:需要了解的关键事项 大型语言模型(LLM)是在大型数据集上训练的模型,用于理解和生成内容。LLM利用transformer模型,具有位置编码和自注意力的重要特性。…

    工具软件 2023年10月16日
  • Deasie:LLM数据服务

    Deasie:LLM数据服务 这是一家为LLM应用提供数据治理的公司。他们的服务包括检测敏感信息、确定数据的上下文和含义、为文档分配质量分数以及创建认证数据目录。

    2023年10月16日
  • 建立自己的 AI 代理员工队伍 – 分步教程

    建立自己的虚拟助手或 AI 代理的 AI 劳动力比您想象的要容易得多。如果您的计算机运行超过 8 GB 的 RAM,您可以在几分钟内使用 Ollama 轻松安装您自己的个人 AI。…

    2023年10月14日
  • 如何构建会思考的 AI 模型

    如果您有兴趣了解有关如何构建思考人工智能AI模型的更多信息,您可能会发现4IR与David Shapiro一起创建的快速概述指南和视频非常有用。自主认知实体 (ACE) 框架是一种…

    2023年10月12日
  • 如何构建会思考的 AI 模型

    如果您有兴趣了解有关如何构建思考人工智能AI模型的更多信息,您可能会发现4IR与David Shapiro一起创建的快速概述指南和视频非常有用。自主认知实体 (ACE) 框架是一种…

    2023年10月9日
  • 使用 Autogen AI 代理框架完全自动化内容创建

    最近,Microsoft非常悄悄地向GitHub发布了一个新的多AI代理框架,以Autogen的形式。为任何感兴趣的人提供一种非常轻松地创建自定义 AI 代理工作流的方法。例如能够…

    2023年10月5日