工具软件
-
我该使用哪款 AI?AI 模型的超能力与现状
一年多来,GPT-4 一直是占主导地位的 AI 模型,显然比任何其他可用的 LLM 系统都要聪明得多。这种情况在上个月发生了变化,现在有三个GPT-4级模型,它们都为自己的聊天机器…
-
DepthFM: 使用深度流匹配技术的快速单目深度预测
DepthFM: 使用深度流匹配技术的快速单目深度预测 一个深度图分析模型,通过流匹配(Flow Matching)技术,可以有效地实现这一目标,因为它在解空间中形成的直线轨迹既高…
-
VoiceCraft:超过XTTS的语音模型
VoiceCraft:超过XTTS的语音模型 VOICECRAFT模型介绍: VOICECRAFT是一个先进的神经编解码语言模型,专门用于语音编辑和零样本文本到语音(TTS)任务。…
-
Mora:借助多智能体系统实现通用视频生成
Mora:借助多智能体系统实现通用视频生成 微软的一个视频生成项目 Mora,利用 Agents 来复原 Sora 的能力,基本还原了 Sora 所有的能力,目前支持生成 1024…
-
AnyV2V:适用于任何视频到视频编辑任务的即插即用框架
AnyV2V:适用于任何视频到视频编辑任务的即插即用框架 AnyV2V框架的介绍: AnyV2V是一个新颖的训练免费框架,旨在简化视频编辑任务。它将视频编辑分解为两个主要步骤:首先…
-
FRESCO:实现零样本视频翻译的空间与时间匹配技术
FRESCO:实现零样本视频翻译的空间与时间匹配技术 终于有完整的视频转视频的项目了,不用在搞复杂的工作流,北大发布了FRESCO视频转视频项目 支持将视频转换为不同的风格,而且支…
-
OMG: 在扩散模型中友好处理遮挡的个性化多概念生成
OMG: 在扩散模型中友好处理遮挡的个性化多概念生成 腾讯这个新研究,支持多角色多概念在一张图片中生成。以前的 ID 或者概念保持项目只能将一个人还原在图片里面,有了这个项目以后就…
-
字节发布了AnimateDiff-Lightning 模型
字节发布了AnimateDiff-Lightning 模型 字节发布了AnimateDiff-Lightning 模型,只需要 4-8 步的推理就可以生成质量非常不错的视频。 跟 …
-
APISR:以动漫制作为灵感,实现现实图像的动漫风格超分辨率增强
APISR:以动漫制作为灵感,实现现实图像的动漫风格超分辨率增强 基于动漫制作流程的图像超分辨率数据集(API) 作者提出了一种新的动漫图像收集管道,并介绍了基于动漫制作的图像(A…
-
ComfyUI发色更换工作流教程
ComfyUI发色更换工作流教程 根据Datou的工作流发散了一下做了一个更换发色的工作流还有对应的讲解。 我会先大概讲一下原理,然后再讲对应节点的作用和参数。最后会发散一下其他的…