单击并拖动 AI 图像编辑可以改变一切

人工智能的最新发展是一种工具，可让您根据自己的规格编辑已生成的图像。

假设您想“通过简单的点击和拖动改变汽车的尺寸或将微笑变成皱眉”，您可以使用这个名为 DragGAN 的模型来实现。

拖动你的 GAN：生成图像流形上基于点的交互式操作
论文页面： https://t.co/Gjcm1smqfl pic.twitter.com/XHQIiMdYOA
—— AK (@_akhaliq) 2023 年 5 月 19 日

生成对抗网络（GAN）目前处于研究论文的形式，然而，它已经获得了那些有兴趣观看其演示的人的关注，以至于研究团队的主页因流量过大而崩溃。

The Verge将 DragGAN 与 Photoshop 中的 Warp 工具进行了比较，并补充说它更强大，因为它不会“模糊周围的像素”，而是“重新生成底层对象”，甚至可以旋转 3D 图像。

这种工具的潜力在于文本到图像的生成 AI 并不总是输出您可能想要的内容。因此，您之后可以返回并对现有图像进行编辑，而不必自动生成新图像。

研究论文中的一些演示包括增加山的高度、改变模特的位置、编辑她衣服的长度和形状、张开或合上狮子的嘴，以及将一个人的脸从普通的样子变成一个微笑。目前市面上有很多人工智能工具，用户必须根据更具体的提示重新生成图像，才能获得更理想的结果。

研究小组在其论文中指出，可以在图像编辑方面的再生中添加新的细节，这有利于更新。 “我们的方法可以产生幻觉，比如狮子嘴里的牙齿，并且可以随着物体的刚度变形，比如马腿的弯曲。”

许多品牌都在尝试为生成的 AI 内容提供编辑选项。然而，大多数都没有允许对图像进行实际编辑，而是允许围绕图像进行编辑等方面。例如， Microsoft 的 Designer 应用程序允许您根据文本提示生成 AI 图像，您可以从三个结果中选择您最喜欢的，然后将其带到设计工作室，在那里您可以创建大量基于创造力和生产力的项目，例如社交媒体帖子、邀请函、数字明信片或以图像为焦点的图形。但是，您无法编辑 AI 生成的图像。

由于 DragGAN 工具目前仍处于演示状态，因此无法说明现成技术的质量如何，或者是否有可能，特别是因为演示基于低分辨率视频。然而，这是一个有趣的例子，说明人工智能的发展速度有多快。

Posted

20 5 月, 2023

blog

技術新聞普遍器

Tags: