在英特尔 ARC GPU、iGPU 和 CPU 上运行 Llama 2 13B

2023年8月16日下午8:48 • 最新资讯

在不断发展的人工智能世界中，最近推出的 Meta Llama 2 大型语言模型引起了技术爱好者的兴趣。进行了引人入胜的演示，展示了 Llama 2 13B 在英特尔 ARC GPU、iGPU 和 CPU 上的运行。本演示提供了这些设备与这种高级语言模型配对时的潜力的一瞥。

Llama 2 是元维基推出的开源语言模型。它有各种版本，其中一些专门用于聊天。它根据公共数据进行训练，并针对特定目的进行微调。它的性能非常显着，旨在成为开发人员在人工智能项目中创新的工具。Meta 的基本理念是促进 AI 领域的开放式协作。

Llama 2的特点

可用性：
- Llama 2 是一个开源语言模型。
- 任何人，无论是个人、创作者、研究人员还是企业，都可以免费访问它。
- 这是 Meta 鼓励人工智能领域开放性的努力的一部分。
- 目标是允许尽可能多的人对模型进行测试、创新和改进。
版本和型号：
- 骆驼 2 不仅仅是一个模型;它是模型的集合。
- 这些模型的大小各不相同，最小的模型有 7 亿个参数，最大的有 70 亿个参数。
- 一个特定的版本，Llama-2-chat，是专门为对话而设计的。
培训和微调：
- Llama 2的初始训练使用了来自公共领域的数据。
- 对于聊天优化版本（Llama-2-chat），进行了额外的培训。这种训练称为监督微调。
- 微调过程还涉及强化学习的技术，使用拒绝抽样和近端策略优化（PPO）等方法。
性能：
- 与其他开源聊天模型相比，Llama 2 及其变体在大多数基准测试中都更胜一筹。
- 它有可能取代一些专有模型。
- 该模型已经过评估，以确保它提供有用和安全的响应。
使用案例：
- Meta 发布 Llama 2 的目标是为开发者提供一个强大的 AI 工具。
- 该工具可以帮助各种与人工智能相关的项目，使他们能够负责任地进行实验、创新和扩展他们的想法。
经营理念：
- 发布 Llama 2 符合 Meta 拥有更开放的 AI 生态系统的愿景。
- Meta 相信协作，并希望广泛的开发人员和研究人员社区在 AI 领域共同努力。

您可以申请在Meta AI官方网站上下载最新的Llama 2 LLM。

在英特尔 ARC GPU、iGPU 和 CPU 上运行 Llama 2

下面的演示涉及在英特尔 Arc GPU 上运行 Llama 2 模型，其惊人的 13 亿和 7 亿个参数。这是使用 Lava CPP 库和 CL Blast 库实现的，它们都有助于加速矩阵乘法和其他数学运算。但是，请务必注意，该方法并未针对英特尔锐炫设备进行全面优化，这意味着它没有充分利用其功能。尽管如此，该过程的速度和可用性值得称赞。

诚然，从源代码编译库的过程漫长而乏味，但在英特尔锐炫设备、英特尔集成 GPU 和 CPU 上的结果显而易见。cmake 工具是此过程的关键组件，需要安装在系统上。此外，需要安装和构建提供加速数学功能的CL Bblast库。此库需要 OpenCL，必须在构建期间提供。

一旦建立了CL Bblast库，就会生成CL blast.dll和GL blast.lib文件。然后这些文件被用来编译骆驼.cpp库。生成的最终可执行文件用于在 Arc GPU 和集成 GPU 上运行 Llama 模型。提供环境变量的平台路径非常重要，这样程序才能找到它。

Llama 13亿模型是8位量化的，可以在GPU上运行并提供快速预测。Llama 7亿模型也可以在GPU上运行，并提供更快的结果。该模型也可以在集成GPU上运行，虽然速度较慢，但仍可用。在 CPU 上运行模型会导致高 CPU 活动，但它仍然是一个可行的选择。

在英特尔 ARC GPU、iGPU 和 CPU 上运行 Llama 2 13B 的探索证明了人工智能领域令人兴奋的进步，以及这些设备的潜力，以及在经济实惠的计算机上本地运行这些强大的大型语言模型的能力。

原创文章，作者：校长，如若转载，请注明出处：https://www.yundongfang.com/Yun249325.html

Llama 语言模型运行

打赏

微信扫一扫不于多少！

支付宝扫一扫礼轻情意重

WhatsApp 正试验 AI 生成贴图功能

上一篇 2023年8月16日下午7:35

什么是RAM（随机存取存储器）？

下一篇 2023年8月16日下午8:54

如何在本地运行 Meta AI 的 Llama 3

Meta 的最新语言模型 Llama 3 现已免费推出。虽然您可以使用运行相同 LLM 的 Meta AI，但也可以选择下载模型并在您的系统上本地运行它。以下是在本地运行 Meta…

2024年4月29日 • 技术教程
Microsoft.NET Error HRESULT error 0xc8000222：如何修复

Microsoft .NET Framework 被许多 Windows 应用程序使用。但是，在计算机上安装 .NET Framework 时，可能会遇到以下消息“安装未成功。HR…

2024年3月25日 • 微软Microsoft
什么是inetcpl.cpl以及如何修复其错误

netcpl.cpl 或 Internet 属性是一个内置实用程序，允许用户配置与 Internet 相关的设置，包括安全、隐私、证书、VPN 和加载项。它存储在以下位置：C:\W…

2024年3月18日 • 工具软件
工具软件

如何将笔记本电脑设置为家庭服务器

如果您正在考虑将笔记本电脑用作家庭服务器的可能性，您会很高兴知道 Wolfgang 创建了一个很棒的教程和概述，介绍了您如何使用 Ninker N16 Pro 笔记本电脑创建家庭服…

2023年12月29日
谷歌Google

将Gemini Pro AI与LangChain相结合，打造迷你检索增强生成（RAG）系统

在快速发展的语言处理世界中，Gemini Pro等高级工具与LangChain的集成对于那些希望增强其语言模型能力的人来说是向前迈出的重要一步。本指南专为具有半技术背景的个人而设计…

2023年12月18日
工具软件

使用 Promptfoo 改进您的 AI 提示以获得更高水平的结果

能够与 AI 语言模型进行良好沟通对任何人来说都越来越重要，无论您是个人、开发人员还是企业，都依赖于我们根据严格的要求创建特定的提示。但是，我们怎么知道我们是否创建了最好的提示呢？…

2023年12月13日
如何修复EA应用程序中暂时丢失的连接错误

您在 EA 应用程序中可能遇到的最烦人的错误是“暂时失去连接”消息，而其他基于 Internet 的东西工作正常。这个问题已成为许多游戏玩家的主要麻烦来源。因此，我们列出了这些非常…

2023年12月3日 • 技术教程
工具软件

LM Studio：发现、下载和运行本地 LLM

LM Studio：发现、下载和运行本地 LLM LM Studio是一个可以在本地运行语言模型的应用,用户可以从HuggingFace下载任何兼容的模型文件,如Llama、MPT…

2023年11月27日
EmotiVoice 是一款功能强大的现代开源文本转语音引擎

EmotiVoice 是一款功能强大的现代开源文本转语音引擎。EmotiVoice 提供中英文两种语言，超过 2000 种不同的声音。最突出的功能是情感合成，允许您创建具有多种情感…

工具软件 2023年11月23日
GPT4 paper assistant: 用GPT-4建立的论文助手机器人项目

该存储库为 Arxiv 实现了一个非常简单的日常扫描仪，它使用 GPT4 和作者匹配来查找您可能感兴趣的论文。它将每天通过 github actions 运行，并可以通过机器人将此…

工具软件 2023年11月23日
工具软件

Pinokio AI 虚拟计算机让您只需单击一下即可安装、运行和自动化任何 AI 应用程序

设置和运行大量可用的人工智能应用程序、模型和工具可能需要相当长的时间。然而，一个名为 Pinokio 的工具经过专门设计，让您只需单击一下即可安装、运行和自动化任何 AI 应用程序…

2023年11月2日
工具软件

使用大型语言模型和个人数据构建 AI 聊天应用

任何有兴趣了解有关构建 AI 聊天应用程序的更多信息的人。有兴趣知道IBM已经创建了一个非常快速和中肯的介绍，以使用检索增强生成（RAG）和大型语言模型。通过构建自己的聊天应用程序…

2023年10月24日
工具软件

LLama 2 13B 与Mistral 7B LLM 模型比较

如果您有兴趣了解有关大型语言模型如何比较的更多信息，您可能会对LLama 2 13B与Mistral 7B之间的比较感兴趣，该比较揭示了不同AI模型之间的差异。这两种型号功能强大且…

2023年10月12日
工具软件

学习如何使用LangChain – 初学者指南

如果您对使用 AI 构建应用程序和服务感兴趣，您绝对应该学习如何使用 LangChain 以及如何使用它来简化使用各种不同的 AI 模型构建应用程序的过程。人工智能和自然语言处理（…

2023年10月2日
检查和重置Windows 11正常运行时间的4种方法

有时为了确保您的 PC 正常工作，您需要检查您的 Windows 11 正常运行时间。这个过程非常简单，可以在短时间内完成，所以今天我们将向您展示在您的 PC 上执行此操作的最佳方…

2023年9月19日 • 最新资讯
谷歌Gemini AI开始向企业推出抢先体验

一些企业已经获得了谷歌即将推出的人工智能语言模型Gemini的访问权限。谷歌已授予一组精选公司提前访问Gemini，这标志着其与消费者服务集成以及通过Google的云部门向企业提供…

工具软件 2023年9月18日
工具软件

如何在 RunPod、AWS 或 Azure 上运行 Llama 2 32k

任何对能够创建和运行私有AI大型语言模型感兴趣的人都可能对这个快速指南感兴趣，该指南提供了有关在较小上下文中运行Llama 2的更多信息，并实现了需要GPU租赁的完整32,000个…

2023年9月12日
工具软件

如何使用Code Llama作为 ChatGPT-4 的替代品编写代码

高效和有效地编写代码的能力是一项需求量很大的技能，由于过去几年人工智能的爆炸式增长，学习或提高编码技能从未如此简单。随着大型语言模型（LLM）的出现，编码过程已经发生了革命性的变化…

2023年9月8日
苹果Apple

Apple每天花百万美元训练语言模型为iOS 18作准备

Apple 在人工智能方面的投资显著增加，特别是在 AI 和机器学习研究领域。尽管Apple的AI负责人John Giannandrea对AI聊天机器人持怀疑态度，但他四年前就组…

2023年9月7日
工具软件

聊天GPT 4与Code Llama编码结果比较

如果您有兴趣了解有关在编码程序时使用 ChatGPT 4 与代码骆驼之间的差异的更多信息，本快速概述将更深入地了解两者的功能。 ChatGPT 4 与Code Llama之间的比较…

2023年9月4日
最新资讯

如何免费在线使用 Llama 2 和Code Llama

如果您想使用 Meta 发布的新编码助手或目前可用于 Llama 2 会话 AI 大语言模型的不同模型，也可以通过 Meta 提供。本快速指南将概述两者可以免费在线使用的位置。使…

2023年8月30日
谷歌Google

Code Llama 与 ChatGPT 编码比较和测试

程序员和开发人员不断寻求工具来优化他们的工作流程，使编码过程更加直观和高效。如果您一直在寻找下一个编码工具来改变您的编码体验，您会很高兴知道 Meta 推出了其最新作品：Code …

2023年8月29日
Meta 推出 AI 编程工具 Code Llama，商业领域免费可用

Meta 现推出了一个名为 Code Llama 的 AI 编码工具，号称“最先进的大型编码语言模型”。该模型基于 Llama 2 大型语言模型打造，可以理解为“Llama 2 …

2023年8月24日 • 工具软件
工具软件

LLaMA 2 70B 在单个 GPU 上运行，带有 Llama Banker

任何有兴趣使用人工智能浏览无聊的公司文件和年度报告的人都可能对新版本的Llama Banker感兴趣，该版本由开发人员Nicholas Renotte使用在单个GPU上运行的LLa…

2023年8月22日
工具软件

如何使用云访问在本地安装 Llama 2

在语言模型领域，Llama 2是人工智能力量的有力证明。本指南提供了有关如何在本地安装 Llama 2 并在云上访问它的更多见解，这一过程释放了这种非凡语言模型的全部潜力。 Lla…

2023年8月16日

在英特尔 ARC GPU、iGPU 和 CPU 上运行 Llama 2 13B

Llama 2的特点

在英特尔 ARC GPU、iGPU 和 CPU 上运行 Llama 2

相关推荐