Mora：借助多智能体系统实现通用视频生成

2024年3月26日下午4:13 • 工具软件

Mora：借助多智能体系统实现通用视频生成

微软的一个视频生成项目 Mora，利用 Agents 来复原 Sora 的能力，基本还原了 Sora 所有的能力，目前支持生成 1024*576 分辨率的 12 秒视频。

还原的能力包括：

1）将文本转换为视频
2）根据文本条件将图片转换为视频
3）扩展已生成的视频
4）进行视频到视频的编辑
5）串联视频以及
6）模拟数字世界

项目简介：

本论文提出了一种新型的多AI智能体框架——Mora。Mora融合了多个尖端视觉AI智能体，致力于复刻Sora所展示的通用视频生成能力。

具体来说，Mora能够运用多个视觉智能体，在多种任务中成功模仿Sora的视频生成能力。

我们的广泛实验结果显示，Mora在这些任务上的表现已经接近Sora。然而，如果从整体上评估，我们的模型与Sora之间还是存在一定的性能差距。

总的来说，我们希望这个项目能够引领未来视频生成技术的发展方向，通过多AI智能体的协同工作来实现。

原创文章，作者：校长，如若转载，请注明出处：https://www.yundongfang.com/Yun291858.html

智能体生成视频

打赏

微信扫一扫不于多少！

支付宝扫一扫礼轻情意重

AnyV2V：适用于任何视频到视频编辑任务的即插即用框架

上一篇 2024年3月26日下午4:13

VoiceCraft：超过XTTS的语音模型

下一篇 2024年3月26日下午4:14

苹果Apple

iOS 18.2 通过这五项更改使 Apple Photos 变得更好

Apple 的照片应用程序在 iOS 18 中进行了重大重新设计，但并非所有更改都受到好评。幸运的是，Apple 听取了反馈，并在 iOS 18.2 中对照片进行了五项关键更改。 …

2024年12月28日
阿里开源支持视频理解的多模态 LLM Qwen2-VL

阿里开源支持视频理解的多模态 LLM Qwen2-VL 国内现在还没有特别好的多模态闭源模型尤其是支持视频理解的，阿里这就开源了。不过最大的Qwen2-VL 72B 没有开源，只开…

工具软件 2024年9月20日
工具软件

Polymet ：AI 生成前端界面

Polymet ：AI 生成前端界面 YC 投了一个类似V0 的前端代码生成项目 Polymet。这个比 V0 多了很多很实用的功能对设计的还原也很好。自定义主题色、字体、圆角…

2024年9月20日
工具软件

Morphic Studio：为创建受控视频做的 AI 视频平台

Morphic Studio：为创建受控视频做的 AI 视频平台 Morphic Studio 包括 Canvas 和 Compose 功能，Canvas 是一个全面的故事板和生成…

2024年8月31日
工具软件

Clapper app：AI 剪辑工具

Clapper app：AI 剪辑工具非常强的网页端 AI 生成和视频剪辑工具。接入了 AI 视频需要的各种 API，包括图片生成、LLM、语音生成、音乐生成、视频生成。时间轴直…

2024年8月31日
工具软件

The AI Scientist：可以进行自主科学发现和论文撰写的 Agents

The AI Scientist：可以进行自主科学发现和论文撰写的 Agents Sakana AI 宣布开发了一个名为 “The AI Scientist” 的系统，它能够自动化…

2024年8月31日
工具软件

Ideogram 发布了 2.0 图像生成模型

Ideogram 发布了 2.0 图像生成模型图像生成质量大幅提高，产品易用性改善，最强的文字生成能力。尝试了一下发现真的很离谱，不只是文字生成这么简单，可以实现复杂排版搭配色彩…

2024年8月31日
iPhone相机在室内灯光下闪烁/闪烁：修复

您的 iPhone 相机在室内灯光下闪烁或闪烁太多吗？您用 iPhone 拍摄的视频看起来不太好，因为灯光会亮起。您在视频上看到的闪烁是因为刷新率的差异。这是不正常的，有一些方法可…

2024年6月1日 • 苹果Apple
工具软件

User Evaluation：AI 帮助进行用户研究

User Evaluation：AI 帮助进行用户研究 User Evaluation 是一个利用人工智能（AI）来提升用户研究和数据分析的工具。功能特点 AI驱动的转录：支持5…

2024年5月20日
工具软件

Wegic：即时设计团队推出的 AI 网页生成工具

Wegic：即时设计团队推出的 AI 网页生成工具尝试了一下，Wegic 这个 AI 网页生成工具也太好了。通过对话来生成和修改页面门槛确实低了很多。整体网站设计和 IP 都太…

2024年5月20日
工具软件

viva：首个可供使用的 Dit 架构视频生成工具

viva：首个可供使用的 Dit 架构视频生成工具海外产品 viva 发布了首个开放给全部用户使用的 Sora 同架构视频生成模型，而且现阶段免费。支持文本生成视频、图片生成视频…

2024年5月20日
Kimi 智能助手更新 Kimi+ Agent 能力

Kimi 智能助手更新 Kimi+ Agent 能力 Kimi 更新了自己的智能体功能，叫 Kimi+ 。产品层面考虑的非常完整，首批 Kimi+ 的内容都很有用。比如什么值得买驱…

工具软件 2024年5月10日
工具软件

生数科技发布Vidu 视频生成模型

生数科技发布Vidu 视频生成模型生数科技不声不响整了个大活。发布 Vidu 视频生成模型，支持长达 16 秒 1080P 视频直接生成。从演示视频来看一致性、运动幅度都达到了…

2024年5月10日
工具软件

Captions：AI 自动视频剪辑工具

Captions：AI 自动视频剪辑工具 Captions 这个产品可以自动识别超长视频的有价值判断并且自动剪辑成多条适合传播的短视频。生成的短视频可以选择对应的字幕模板，并且支…

2024年5月10日
工具软件

360 AI 浏览器支持 Youtube 视频

360 AI 浏览器支持 Youtube 视频 LLM 的出现让英语知识的获取变得比以前简单非常多，尤其是文字类的内容，翻译以及总结门槛都低了非常多。但是很多知识都在视频里面，我…

2024年5月10日
工具软件

AI音乐生成工具Udio发布

AI音乐生成工具Udio发布音乐生成应用Udio正式发布比Suno有更多的自定义能力。同时整个软件的设计也更偏向内容消费，不只是单纯的当工具在做。前谷歌DeepMind的顶尖A…

2024年5月10日
SWE-agent：类似AI 程序员Devin的项目

SWE-agent：类似AI 程序员Devin的项目 SWE-agent 将 LM（例如 GPT-4）转变为软件工程代理，可以修复真实 GitHub 存储库中的错误和问题。在完整的…

工具软件 2024年5月10日
Midreal：AI小说生成

Midreal：AI小说生成最近发现之前推荐过的 Midreal AI 互动小说游戏更新了网页版本，不需要在 Discord 里面使用了。这次升级非常强大，Midreal已经不…

工具软件 2024年5月10日
工具软件

Open AI 发布了语音克隆方案及Sora艺术家测试视频

Open AI 发布了语音克隆方案及Sora艺术家测试视频多模态的任何一环Open AI都想做啊，这个语音克隆的功能也上了，声音和面部以及身体数据是未来内容生产能力爆炸之后，每个…

2024年5月10日
工具软件

Adobe 的 VideoGigaGAN 项目可以将模糊的视频变成高清

Adobe 的人们开发了一种生成式 AI 模型，该模型很快就会让您将视频升级到原始分辨率的八倍。Adobe在最近发表的一篇名为VideoGigaGAN的论文中声称，该模型远远优于过…

2024年4月25日
工具软件

WhatsApp将获得基于文本的状态更新的新界面以及转发和快退视频的能力

WhatsApp 通过定期更新不断改进。最近的报道表明，WhatsApp正在开发一个新的状态更新界面，为基于文本的更新提供自己的空间。此外，WhatsApp 还改进了平台上的视频播…

2024年4月6日
苹果Apple

如何在iPhone照片应用程序上编辑视频

如何在iPhone照片应用程序上编辑视频在不断发展的数字媒体世界中，视频的质量可以产生重大影响。将 iPhone 放在口袋里，您可以使用一个非常强大的工具来捕获和编辑视频，这些视…

2024年3月29日
苹果Apple

如何在iPhone照片应用程序上编辑视频

如何在iPhone照片应用程序上编辑视频在不断发展的数字媒体世界中，视频的质量可以产生重大影响。将 iPhone 放在口袋里，您可以使用一个非常强大的工具来捕获和编辑视频，这些视…

2024年3月28日
苹果Apple

如何加快iPad的使用速度

如何加快iPad的使用速度寻找更快、更智能地完成工作的方法几乎是每个人的首要任务。iPad 是每个人的首选小工具，从忙碌的专业人士到创意人士和学生，它提供的远不止眼前所见。幸运的…

2024年3月26日
工具软件

5 种 AI 工具可改善您的视频编辑并节省时间

5 种 AI 工具可改善您的视频编辑并节省时间如果您正在寻找减少编辑视频时间的方法，您可能会对五种 AI 工具感兴趣，它们不仅可以改善您的视频编辑工作流程，还可以节省您的时间。您…

2024年3月26日

Mora：借助多智能体系统实现通用视频生成

相关推荐