待图像的同时,能否将其视为一个三维模型,并进一步操作它的角度,使其犹如面对不同方向? 现在,这一切都已不再遥不可及。
这项名为「DragGAN」的研究,其功能远超过 Photoshop 的「Warp」工具,更凌驾于任何现有的图像编辑工具。 相比于仅仅推动像素,这款 AI 工具可以重新生成基底物体。 更令人惊奇的是,透过它,我们甚至可以像操作三维图像一样去旋转图像。
這項新研究成果旨在突破 AI 圖像操控的局限性。簡單的「拖曳」行為,可以使湖面的倒影隨著拖動產生變化,甚至讓山脈的高度因你的點擊而有所升降。然而,這些演示視頻令研究團隊的主頁承受了過大的網路流量壓力,而癱瘓了一段時間。
研究团队指出,这项研究最有趣的部分不仅仅在于图像的操作本身,更在于其用户界面。 目前的 AI 图像生成工具,例如 GANs,可以生成逼真的图像,但在弹性和精确性上存在许多不足。
而 DragGAN 的出现,清晰地为此问题提供了一个解决方案。 在传统的图像扭曲操作中,这个模型不仅可以重新生成主题物体,还可以「幻想」出隐藏的内容,例如狮子嘴里的牙齿,或是马腿的弯曲状态。 然而,这只是目前的演示未来生成式 AI 在图像处理的可能性。 何时才能真正普及化,仍要有待观察。
原创文章,作者:校长,如若转载,请注明出处:https://www.yundongfang.com/Yun228526.html