人工智能:StyleGAN神经网络算法生成理想对象的脸

服务机器人 2021-05-31 09:44www.robotxin.com女性服务机器人
每次打开朋友圈里别人的自拍照,我常常质疑里面的图片的真实性,事实证明美图秀秀已经低成本地让中国人的容颜获得了巨大的提升。尽管修饰过的图片有一定虚假的成分,至少是本人。

还记得网络经常出现的平均脸吗,现在又有新技术升级了。NVIDIA提出一项新技术,一种基于风格的GAN生成器架构(StyleGAN),提出了一个新的模型,解决了这一挑战。该技术不仅可以更好地理解输入的图像,而且还能够根据原图生成更真实的高分辨率图像。

StyleGAN 逐渐生成人工图像,从非常低的分辨率开始,一直持续到高分辨率 (1024×1024)。通过单独修改每个级别的输入,它控制以该级别表示的视觉要素,从粗糙的特征(姿势、面部形状)到精细细节(头发颜色),而不影响其他级别。

生成对抗网络 (GAN) 是中一个相对较新的概念,于 2014 年推出。这项技术合成人造图像或3D影像,已经可以跟真实图像无法区分。虽然 GAN 图像随着时间的推移变得更加逼真,但他们的主要挑战之一是改变面部图像中的具体特征,如姿势、面部形状和发型。GAN 应用程序的一个常见示例是通过从名人面孔数据集中学习来生成人工人脸图像。

GAN原理

2018年,NVIDIA与ProGAN一起合作,后者主要创新是渐进式培训 - 它使用非常低的分辨率图像(例如 4 4)训练图片产生器和鉴别器,逐渐发展出更高分辨率层。此技术通过学习即使在低分辨率图像中显示的基本要素来创建图像的基础,并随着时间的推移了解越来越多的细节。

ProGAN原理

虽然ProGAN 生成高质量的图像,但它控制生成图像特定功能的能力非常有限。因为图像中的要素是纠缠的,尝试调整输入,哪怕是一点点,通常影响多个要素。

StyleGAN是ProGAN 网络技术的升级版本,重点是图像生成器网络,新技术包括映射网络生成器,AdaIN(自适应实例规范化)模块,删除传统输入和随机变异技术,样式混合和微调等多项技巧。可以通过原来输入的人像合成出完全不存在的新人像。

总部位于阿根廷公司叫Icons8,是一家专门搜集制作数字图标、灵感图片的设计公司。公司声称将StyleGAN商业化,利用新的图像合成技术,可以制作 "无版权忧虑,多模合成,AI随需求随机生成"的虚拟人像照片(orry-free, diverse models,on demand using AI)。

公司通过海量的人脸数据训练人工智能,根据需求复制需要人脸特征,可以做出全新的虚拟人脸,目前的技术完全可以欺骗人眼,后续甚至会推出人工智能生成的带表情的动态虚拟人脸。该公司已经推出了自己的网站,网站允许任何人根据不同年龄、不同种族、不同情感、性别、眼睛颜色和头发长度来生成虚拟照片。

Icons8公司的创始人伊万布劳恩说,该公司在世界各地的工作室里为大约70位模特拍摄了成千上万张照片,作为最原始的脸谱数据模型,然后他们花了几个月的时间编辑图片,标记数据,按照电脑规格整理成一个数据库。

依据原始图片,工程师们使用一种名为StyleGAN的人工智能系统来输出大量的新照片,在一天内生成100万张图像。然后,他的团队挑选了10万张最有说服力的图片,供公众使用。未来几个月还会产生更多。

目前Icons8公司已与客户签约,用在约会应用程序和人力资源规划管理上,布劳恩拒绝透露客户的名字。约会应用主要是将这些技术用在聊天机器人上。

尽管人工智能专家还担心,这项技术可能会帮助骗子、间谍创建虚假资料,他们同样可以会利用这些技术来构建虚拟的在线角色,这会加剧整个互联网的信任危机。目前在互联网上,虚假信息宣传、深度伪造的视频和其它欺骗手段已经使人们对互联网真实性构成了危害。

加州大学洛杉矶分校法学院(UCLA's la school)人工智能、法律和政策研究员埃拉娜泽德(Elana Zeide)表示,我们已经习惯了有感官输入的物理世界,如果我们无法用本能或被直接反应来分辨什么是真实,什么虚拟,人们将无所适从。这项技术最开始打算在不方便真人展示的隐私场合和特定文化宣传中应用,但广告公司立刻发现巨大前景,可以在完全没有一个真人出场的情况下,一样可以做出超级豪华阵容的盛会效果。最担心的是模特们,靠脸和身材吃饭而无限风光的他们,将来可能会被AI抢走工作吗?也许,谁也阻止不了未来。

Copyright © 2016-2025 www.robotxin.com 人工智能机器人网 版权所有 Power by