评估-云东方

一亿上下文长度的 LLM：LTM-2-Mini Magic 发布了一个具有 1 亿 Token 上下文的模型 LTM-2-mini。1 亿 Token相当于大约 1000 万行代码…

工具软件 2024年9月20日

工具软件

DALL-E3向所有Plus用户开放，公布了训练论文 Open AI向所有ChatGPT Plus 和 Enterprise 用户开放了DALL-E3的使用权限，同时还公布了两篇论…

2023年10月23日

工具软件

在快速发展的人工智能领域，对人工智能推理的最佳大语言模型（LLM）的追求变得越来越重要。随着行业和研究人员深入研究这些模型的复杂性，他们试图发现哪个智能体在逻辑推理、决策和解决问题…

2023年8月24日

工具软件

如果您有兴趣了解有关如何对AI大型语言模型或LLM进行基准测试的更多信息，那么一种新的基准测试工具Agent Bench已成为游戏规则的改变者。这个创新工具经过精心设计，将大型语言…

2023年8月17日

开发人员和有兴趣在推出期间访问最新的 OpenAi GPT-4 API 访问权限的人可能有兴趣了解。OpenAI正在优先考虑对为OpenAI Evals提供特殊模型评估的开发人员的…

最新资讯 2023年6月22日