X AI 公布了 Gork 1.5V 多模态 LLM
X AI 咋老是周五发消息,他们的宣传风格和其他家不太一样啊。正式发布了 Grok-1.5 V 多模态模型。
那个真实世界QA比GPT-4V和Claude3都强。
为了测评对真实世界的理解他们还推出了一个专门的测试集RealWorldQA。
该基准旨在评估多模态模型的基本真实世界空间理解能力。数据集是开源的。
最初发布的 RealWorldQA 包含 700 多张图片,每张图片都有一个问题和易于验证的答案。
除其他真实世界的图像外,该数据集还包括从车辆上拍摄的匿名图像(从特斯拉薅的?)。
原创文章,作者:校长,如若转载,请注明出处:https://www.yundongfang.com/Yun295787.html