xAI 发布 Grok-2 系列模型
老马的 XAI 发布 Grok-2 Beta 版本。在LMSYS的成绩超过了Claude 3.5 Sonnet 和 GPT-4-Turbo。
Grok-2 和 Grok-2 mini 目前在 𝕏 上测试,这个月可以通过 API 使用。
𝕏 上的 Grok 界面也获得了更新,𝕏 Premium 和 Premium+ 用户都可以访问新模型。图片生成能力用的最近非常火的 FLUX 图像生成模型。
XAI 还说他们内容使用类似LMSYS的流程来对模型进行评估,在每次互动中,AI 导师模型会看到 Grok 生成的两个回应。根据指南中概述的具体标准选择更优秀的回应。专注于评估模型在两个关键领域的能力:遵循指示和提供准确的事实信息。
Grok-2 在推理检索内容和工具使用能力方面显示出显著改进,例如正确识别缺失信息、推理事件序列以及丢弃无关的帖子。
这一点在结合推特内容分析上明显变好了,你可以让 Grok 分析你的内容以及互动来改善账号的运营情况。
他们下一步将会发布 Grok 多模态模型的预览。
原创文章,作者:校长,如若转载,请注明出处:https://www.yundongfang.com/Yun299412.html