DragGAN 是一款新的 AI 应用程序,可让您通过在图像上拖动来轻松调整照片和艺术。它真的就是这么简单,坦率地说,我有点痴迷于它。
我们已经看到了 Diffusion 应用程序,如 DALLE.2、Stable Diffusion 和 Midjourney,如何用 AI 家庭聚会图像和假啤酒广告吓坏我们,但现在我们开始看到 GAN(生成对抗网络)的使用,如果 DragGAN 有什么可取之处,这些会更有用。
虽然这款AI图像编辑软件还处于早期阶段 – DragGAN作为白皮书存在 – 结果令人着迷。DragGAN 是一种交互式方式,通过标记图像上的点来编辑照片或艺术作品,只是……拖动。人工智能完成了所有艰苦的工作。
该应用程序使用 AI 来操作图像。有一些技术术语在起作用,但本质上人工智能使您能够在保持其完整性的同时影响图像;本质上,DragGAN 允许您使用交互点使图像变形,而生成式 AI 协助进行更改以获得平滑准确的最终结果。
您可以调整设置为各种类别的图像,包括动物,汽车和人物以及风景,并调整从图像布局到姿势和形状的所有内容,甚至可以更改照片中人物的表情。
研究小组写道:“想象一下,能够将图像的任何点’拖动’到你想要的位置。这就是我们的目标是通过我们的新方法实现的目标,我们称之为DragGAN。
他们解释了它是如何工作的:“DragGAN 有两个主要部分。第一种是基于特征的运动监督,可帮助您将图像中的任何点移动到目标位置。第二部分是新的点跟踪方法,有助于跟踪这些点的位置。使用DragGAN,任何人都可以使图像变形,并精确控制每个像素的最终位置。
DragGAN 类似于 Photoshop 中的扭曲变形(Warp)工具,但更加强大,因为它不是“挤压像素”,而是“重新生成物体”,甚至可以旋转三维图像。这种工具的潜力在于,从文本生成图像的人工智能并不总是能输出你想要的结果,所以你可以在生成图像之后再进行编辑,而不必重新生成一个新的图像。研究论文中展示了一些演示案例,包括增加山峰的高度,改变模特的姿势和衣服的长度和形状,张开或闭合狮子的嘴巴,以及将一个人的表情从平淡变成微笑。
目前很多公司都在尝试提供一些针对生成性 AI 内容的功能,但不能编辑 AI 生成的图像。
由于 DragGAN 目前还只是一个演示,还不清楚什么时候真正推出,以及推出后的效果如何,尤其是考虑到演示视频都是基于低分辨率的图像。不过这个技术的潜力还是非常大的,如果你也接到了“把大象转个身”的 P 图需求,未来这个技术可以帮你完成任务。
原创文章,作者:校长,如若转载,请注明出处:https://www.yundongfang.com/Yun228496.html