Llemma：数学 LLM

2023年10月23日下午10:42 • 工具软件

Llemma：数学 LLM

开源 LLM，用于在最多 200B 个数学文本标记上进行训练的数学LLM。Llemma 34B 的性能接近 Google 的 Minerva 62B，尽管其参数只有一半。使用Proof-Pile-2，一种混合科学论文、包含数学内容的网络数据和数学代码，从而产生Llemma。在MATH基准测试中，Llemma在等参数基础上优于所有已知的开放基模型，以及未发布的Minerva模型套件。此外，Llemma能够在无需进一步微调的情况下进行工具使用和形式定理证明。

原创文章，作者：校长，如若转载，请注明出处：https://www.yundongfang.com/Yun262290.html

打赏

微信扫一扫不于多少！

支付宝扫一扫礼轻情意重

将 LLM 当做操作系统

上一篇 2023年10月23日

Chrome 浏览器将可隐藏你的 IP 位置

下一篇 2023年10月24日

Jan：本地LLM聊天软件

Jan：本地LLM聊天软件一个全平台的本地 LLM 聊天软件Jan，支持自动下载模型以及非常详细的设置。懒得配置 Ollama 的可以试试。除了支持本地模型以外，在线的模型可…

工具软件 2024年5月10日
Opera 成为第一个集成本地 AI 模型的主要浏览器

Opera 正在将对 150 种本地 LLM（大型语言模型）变体的支持集成到 Opera One（该公司的 AI 集成浏览器）的开发人员流中。添加对 AI 的实验性本地支持是浏览器…

2024年4月6日 • 工具软件
工具软件

提升本地 AI 大型语言模型（LLM）的智能

提升本地 AI 大型语言模型（LLM）的智能在快速发展的自然语言处理领域，出现了一种新的方法来提高大型语言模型（LLM）的本地AI性能、智能和响应准确性。通过将代码分析和执行…

2024年3月17日
工具软件

AI Math Review：最强大的 AI 数学问题解决器

随着技术的快速发展，学生经常在寻找高效可靠的解决方案来解决数学作业。一个受到广泛关注的解决方案是 AIMath，一个数学 AI 家庭作业求解器。在这篇评论中，我们将仔细研究 AI…

2024年3月15日
工具软件

什么是LangChain，如何使用它？

什么是LangChain，如何使用它？如果您一直在寻找可以使您的工作更顺畅、项目更令人印象深刻的工具。您可能听说过围绕大型语言模型（LLM）的嗡嗡声，以及它们改变我们与技术交…

2024年3月15日
工具软件

Notdiamond-0001：自动选择LLM模型

Notdiamond-0001：自动选择LLM模型 Notdiamond-0001这个项目可以自动帮你选择将用户的问题发送给GPT-4还是GPT-3.5，从而大幅降低调用模型的成本…

2023年12月19日
工具软件

LLM Visualization

LLM Visualization 这个 LLM 算法的可视化演示太强了，之前我们看到的都是 2D 的，这个是 3D 的。而且他完整的展示了整个 LLM不同模块内部的运作机制和各模…

2023年12月19日
工具软件

大型语言模型简介：它们是什么以及它们如何工作？

大型语言模型（LLM）已成为不断发展的技术世界中的一项革命性发展。大型语言模型具有多种应用，从自动完成句子等简单任务到翻译语言、生成创意内容，甚至参与类似人类的对话等复杂任务。…

2023年12月5日
工具软件

LLM AI 代理是什么，如何使用它们？

由大型语言模型（LLM）提供支持的 LLM AI 代理代表了人工智能领域的一个新领域。这些系统利用LLM的能力来推理问题，制定解决问题的计划，并在执行过程中出现不可预见的问题时…

2023年12月1日
工具软件

开源大型语言模型与专有（LLM）的优势

随着 Huggingface 上可用的大型语言模型（LLM）数量的增加，关注专有模型和开源模型之间的区别对于 AI 爱好者和企业理解至关重要。专有 LLM 由有使用限制的公司…

2023年11月28日
最新资讯

新推出的 LLM Inflection-2 声称其性能优于谷歌的旗舰 PaLM 2，仅次于 GPT4

Inflection AI 宣布发布 Inflection-2，这是一种新的大型语言模型（LLM），是当今世界上仅次于 OpenAI 的 GPT4 的第二大 LLM。什么是LL…

2023年11月23日
谷歌Google

Google Bard现在可以提供数学问题的分步解释，就像Microsoft Math Solver一样

谷歌刚刚“放宽”了其年龄限制政策，将其复杂的人工智能聊天机器人Google Bard用于几个选定的青少年，主要是非欧洲国家。同时，这家科技巨头还扩展了聊天机器人在解决数学问题时的能…

2023年11月19日
工具软件

催眠 AI 以使用自然语言绕过现有规则或 LLM 安全性

大型语言模型（LLM）在过去几年中呈爆炸式增长，但它们的安全性如何，它们的响应能否纵？IBM 仔细研究了大型语言模型带来的潜在安全风险，以及可能出于恶意原因操纵它们的策略。大型语…

2023年10月30日
将 LLM 当做操作系统

将 LLM 当做操作系统大型语言模型（LLM）在扩展对话和文档分析等任务中存在上下文窗口有限的局限性。为了解决这个问题，作者提出了虚拟上下文管理，这是一种受传统操作系统的分层存储…

工具软件 2023年10月23日
如何用语音和LLM交谈

如何用语音和LLM交谈文章讨论了使用大型语言模型（LLM）构建语音驱动的人工智能应用。作者解释了构建 LLM 应用程序所需的三个基本组件：语音到文本、文本到语音和 LLM 本身。…

工具软件 2023年10月23日
工具软件

MemGPT 将 LLM 转换为操作系统

不可否认，大型语言模型（LLM）的出现彻底改变了人工智能领域。但是，这些模型并非没有局限性。他们面临的最重大挑战之一是有限的上下文窗口的限制。此限制妨碍了它们在扩展对话和文档分析等…

2023年10月17日
大型语言模型入门：需要了解的关键事项

大型语言模型入门：需要了解的关键事项大型语言模型（LLM）是在大型数据集上训练的模型，用于理解和生成内容。LLM利用transformer模型，具有位置编码和自注意力的重要特性。…

工具软件 2023年10月16日
工具软件

Deasie：LLM数据服务

Deasie：LLM数据服务这是一家为LLM应用提供数据治理的公司。他们的服务包括检测敏感信息、确定数据的上下文和含义、为文档分配质量分数以及创建认证数据目录。

2023年10月16日
微软Microsoft

建立自己的 AI 代理员工队伍 – 分步教程

建立自己的虚拟助手或 AI 代理的 AI 劳动力比您想象的要容易得多。如果您的计算机运行超过 8 GB 的 RAM，您可以在几分钟内使用 Ollama 轻松安装您自己的个人 AI。…

2023年10月14日
工具软件

如何使用思维链原理（COT）编写 AI 提示

如果您与 ChatGPT、Llama 2 或其他 AI 聊天机器人和模型进行过交互，您就会知道提示不仅仅是一个问题——它是解锁模型功能的关键。但是，制作完美的提示可能非常具有挑战性…

2023年9月17日
使用 SmartGPT 框架让 ChatGPT 更加智能

新的框架正在帮助使ChatGPT等语言学习模型（LLM）更加智能，能够自主处理三个不同阶段的复杂任务。通过将任务分解为更小、更易于管理的问题，并利用来自互联网和其他外部来源的信息。…

工具软件 2023年9月2日
工具软件

预训练 vs 微调 vs 指令调整 vs RL 调整 LLM 模型有什么区别？

在机器学习和人工智能这个令人兴奋的领域，不同类型的模型之间的细微差别往往看起来像一个迷宫。具体来说，当涉及到大型语言模型（LLM）时，了解预训练与微调、指令调整与RL调整模型之间的…

2023年8月31日
工具软件

什么是用于人工智能推理的最佳 AI 代理 LLM？

在快速发展的人工智能领域，对人工智能推理的最佳大语言模型（LLM）的追求变得越来越重要。随着行业和研究人员深入研究这些模型的复杂性，他们试图发现哪个智能体在逻辑推理、决策和解决问题…

2023年8月24日
工具软件

什么是大型语言模型LLM？

如果您一直想知道大型语言模型（通常缩写为 LLM）是什么意思。本快速指南将概述它们是什么以及它们是如何工作的。思考它们的一种方法是想象与一个几乎阅读过每本书、文章和网站的人进行对话…

2023年8月18日
使用LLM和Homebrew在您自己的Mac上运行Llama 2

使用LLM和Homebrew在您自己的Mac上运行Llama 2 Llama 2 是 Meta AI 几周前发布的最新商用开放许可大语言模型。我刚刚为我的LLM实用程序发布了一个新…

工具软件 2023年8月8日

Llemma： 数学 LLM

相关推荐

Llemma：数学 LLM