人工智能的最新发展是一种工具,可让您根据自己的规格编辑已生成的图像。
假设您想“通过简单的点击和拖动改变汽车的尺寸或将微笑变成皱眉”,您可以使用这个名为 DragGAN 的模型来实现。
生成对抗网络(GAN)目前处于研究论文的形式,然而,它已经获得了那些有兴趣观看其演示的人的关注,以至于研究团队的主页因流量过大而崩溃。
The Verge将 DragGAN 与 Photoshop 中的 Warp 工具进行了比较,并补充说它更强大,因为它不会“模糊周围的像素”,而是“重新生成底层对象”,甚至可以旋转 3D 图像。
这种工具的潜力在于文本到图像的生成 AI 并不总是输出您可能想要的内容。因此,您之后可以返回并对现有图像进行编辑,而不必自动生成新图像。
研究论文中的一些演示包括增加山的高度、改变模特的位置、编辑她衣服的长度和形状、张开或合上狮子的嘴,以及将一个人的脸从普通的样子变成一个微笑。目前市面上有很多人工智能工具,用户必须根据更具体的提示重新生成图像,才能获得更理想的结果。
研究小组在其论文中指出,可以在图像编辑方面的再生中添加新的细节,这有利于更新。 “我们的方法可以产生幻觉,比如狮子嘴里的牙齿,并且可以随着物体的刚度变形,比如马腿的弯曲。”
许多品牌都在尝试为生成的 AI 内容提供编辑选项。然而,大多数都没有允许对图像进行实际编辑,而是允许围绕图像进行编辑等方面。例如, Microsoft 的 Designer 应用程序允许您根据文本提示生成 AI 图像,您可以从三个结果中选择您最喜欢的,然后将其带到设计工作室,在那里您可以创建大量基于创造力和生产力的项目,例如社交媒体帖子、邀请函、数字明信片或以图像为焦点的图形。但是,您无法编辑 AI 生成的图像。
由于 DragGAN 工具目前仍处于演示状态,因此无法说明现成技术的质量如何,或者是否有可能,特别是因为演示基于低分辨率视频。然而,这是一个有趣的例子,说明人工智能的发展速度有多快。