来自谷歌、麻省理工学院和宾夕法尼亚大学等知名公司和机构的一组研究人员发表了一篇关于一种新的照片编辑应用程序的论文,该应用程序以一种非常有创意的方式利用了人工智能。DragGAN允许用户通过拖动任意两个主要组件来操纵图像,以便进行编辑,例如改变人脸上的表情,使狮子看起来像是在发出凶猛的咆哮。
你有没有想过在圣诞节早上给脾气暴躁的老戴夫叔叔拍张照片时给他一个微笑,或者改变你那只无法拍到好照片的过度活跃的狗的姿势?那么,DragGAN可能就是您正在寻找的编辑工具。它类似于Adobe的Photoshop Warp工具,但可以将图像更改到下一个级别。新的人工智能工具能够重新生成以前不存在的图像区域,而不是简单地以有趣和创造性的方式拉伸像素。截至目前,人工智能驱动软件的例子目前只能通过在线演示获得,但显示出巨大的潜力。
研究人员指出,虽然目前的软件能够通过手动注释的训练数据或先前的3D模型来获得生成对抗性网络(GANs)的可控性,但新方法探索了一种操纵GANs的新方法。它通过两个主要组件来实现这一点。第一种是基于特征的运动监督,它驱动手柄点向目标位置移动。第二种方法涉及一种新的跟踪方法,该方法利用了具有判别力的GAN AI特征,以保持对手柄点的位置的定位。
该研究论文指出,“任何人都可以通过精确控制像素的位置来变形图像,从而操纵动物、汽车、人类、风景等不同类别的姿势、形状、表情和布局。”
虽然这个概念仍在由团队开发中,但它显示出了很大的前景。至少可以说,能够“拍一张狮子在大草原上漫步的照片”的想法很有趣。研究人员表示,他们的“方法会使被遮挡的内容产生幻觉,比如狮子嘴里的牙齿,并会随着物体的刚性而变形,比如马腿的弯曲。”