图像编辑的新时代即将到来
生成式 AI 工具,例如查特,稳定的扩散,Midjourney和达尔-E技术爱好者越来越熟悉,巩固了他们在我们的技术领域的存在。随着主要科技巨头竞相开发最先进的大型语言模型并将其集成到各种软件和在线服务中,出现了大量初创公司,专注于迎合利基应用程序的专业人工智能工具。
这些工具具有基于简单提示生成相关图像或文本的非凡能力,以其看似神奇的输出吸引用户。然而,偶尔的缺点提醒我们,人工智能还没有完全超越人类的创造力。必须承认,其中许多工具依赖于人工编写的训练数据,并且需要人工监督来提高其输出质量。
最佳图像处理
最近的人工智能研究展示了重大进展,特别是在图像处理领域。来自谷歌、麻省理工学院、宾夕法尼亚大学和德国马克斯普朗克信息研究所等知名机构的科学家的合作努力产生了一种旨在使图像编辑民主化的实验工具,使其更容易为公众所使用。
DragGAN AI使用户能够通过简单的点击和拖动技术对物体或个人的外观进行实质性的改变。只需移动鼠标,用户就可以毫不费力地修改面部表情,改变时装模特的服装,或旋转照片中的主体,就好像他们是三维模特一样。尽管在撰写本文时该工具尚未向公众发布,但引人入胜的视频演示震惊了观众,并导致研究团队的网站暂时崩溃。
不要错过AI列车
通过文本提示生成特定和期望输出的复杂性导致了一个新的专业角色的出现——“人工智能提示工程师”。担任此职位的个人每年可以获得高达 335,000 美元的丰厚薪水,所有这些都不需要正式学位。然而,演示视频中展示的 DragGAN AI 界面暗示了一个充满希望的未来,日常用户可以实现以前为 AI 提示工程师保留的壮举。
只需单击并拖动任何图像生成工具的初始输出,用户就可以很快访问这些功能。如果你想了解更多关于 DragGAN AI 的信息,你可以通过此处的链接访问项目页面.
原创文章,作者:校长,如若转载,请注明出处:https://www.yundongfang.com/Yun228556.html