2020-08-06 08:40

宋小宝版庆余年“上线”,换脸视频是如何实现的?

沈腾版斯内普,宋小宝版庆余年,赵四儿版美国队长,PDD版桥本环奈······

AI换脸视频满天飞,我有个朋友对此还提出了些更大胆的想法。

 

不过,看似已经出神入化的AI换脸,到国产神剧里却变成了这样。

所以AI换脸的门槛到底高不高?我朋友那些大胆想法,该怎样实现呢?

 

Deepfake是目前最主流的开源面部替换算法,我们看到的绝大部分换脸视频,都是通过该算法实现的。

 

这种算法是基于人工智能领域的深度学习,可以直接在电脑上运算生成逼真的换脸视频。

以宋小宝版张若昀为例,我们尝试用最简单的语言来解释Deepfake的原理

 

第一步,是给AI准备两份学习材料,一是《庆余年》中我们选中的视频片段,二是宋小宝老师的高清视频素材

 

系统会将两个视频的每一帧都提取成图像文件,并从中识别、抽出人脸信息,生成只含有脸部的图片,作为机器的学习素材。

随后系统将两个人的脸扭曲变化,

并训练AI学会一件事:分别把扭曲的脸还原成本来的模样。

经过一段时间训练,AI修复的人脸几乎与扭曲前的人脸一模一样。

此时系统开始发出大招,丢给AI一张”张若昀“的照片,

丧心病狂地告诉AI:这是一张扭曲的宋小宝的脸,请修复。

此时,已经被PUA的人工智能相信了系统的鬼话,用尽平生所学,

把张若昀的脸“修复”成了宋小宝的脸。

等AI辛辛苦苦将数以千计的张若昀的脸修复成宋小宝之后,

系统再将这些脸放回到原版庆余年之中,

由宋小宝鼎力巨献的《宝余年》就诞生了。

 

当然,这只是为方便大家理解,所做的简单解释。

真实情况中,基础的换脸工具会使用一种叫做“自编码器”(Auto-Encoder)的神经网络,

由一个编码器和两个不同的解码器构成。

训练过程中,张若昀和宋小宝的图像被放进同一个编码器中进行编码,但由两个不同的 解码器A和解码器B分别进行还原。

 

而之所以要让两个解码器共用一个编码器,

是为了让编码器能够找出两个不同人脸的共同特征数据

从而再用相反的解码器实现两个人脸的替换。

 

另外,现在的换脸工具还会使用生成对抗网络(GAN)进行升级,优化换脸效果。

 

知道原理后,我们可以聊聊AI换脸的局限了。

首先是素材,要制作一段真假难辨的宋小宝版《庆余年》视频,

我们必须要有一段时间够长,清晰度够高的宋小宝视频,

或者300张以上宋小宝的照片,交给AI进行训练。

保证数量的基础上,素材中的人脸最好还是各种角度兼具,不能只是千篇一律的45度角自拍

特别要注意侧脸,否则换脸视频中的侧脸镜头,就会出现非常严重的模糊。

另外我们还发现,当原视频中出现,手遮挡脸的镜头时,AI往往会难以处理。

 

此外,制作逼真的换脸视频,需要一块优质的显卡和足够的学习时间。

Deepfake的机器学习主要通过显卡完成,显卡性能越强悍,学习时间越长,就能输出越逼真的视频。

这是我们自己生成的换脸视频,将钢铁侠的脸换到了希亚.拉博夫身上,可以明显看出,随着AI训练时长的增加,换脸效果得到了明显提升。

 

目前来说,下载AI换脸工具后,制作一段基础的换脸视频并不算难,难的是想要达到真假难辨的效果,一般需要对根据不同的明星手动调整参数,

需要花费的精力还是非常大的

所以,还请珍惜你关注的每一个换脸视频博主。

 

有意思的是,就如同没有人知道是谁发明了比特币一样,至今也无人知道是谁开发了Deepfake的源代码。

就像人们尚未真正找到比特币的正确用途一样,目前AI换脸的应用,也仍局限在一些搞笑视频甚至灰色产业中。

但这并不代表AI换脸是没有意义的。事实上,AI换脸能更快速更逼真,也代表着它背后的AI深度学习、神经网络、图像识别等技术的越来越成熟。

其实科技与人类的进步,总是从那些看似毫无用处的新技术开始,它所谓的“毫无用处”,往往错在时代的局限性,而非技术本身。每当一项“无用”的新技术变得“有用”时,这世界会天翻地覆。

 

对AI换脸感兴趣的朋友点赞关注后,可在评论区获取详细教程和下载链接,切记合法合规使用。


本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定