AI鉴黄，一把量出人性的尺子-虎嗅网

文 | 杨苏颖

来源 | 智能相对论（ID：aixdlun）

在1997年版的电影《洛丽塔》里，洛丽塔趴在花园的草坪上读书，天真的脸庞笼罩在朦胧的水雾下。在她的眼波流转之中，电影流露出情色的味道。情色作品的含蓄和丰富常常使其可以借“性”的描述来传达对社会精神状态的思考。但是情色和色情从来不是一回事，而二者模糊的边界却不断让色情内容的传播有了可乘之机。

鉴黄师是在互联网色情内容暴增的条件下滋生的一个职业。然而长期面对大量色情内容的刺激使这类工作者往往要承受心理、生理的双重压力。那么，在人工智能迅速崛起的时代，AI的加入会不会成为鉴黄师们的“减压阀”呢？

AI来了，“东京热”们还会好吗？

互联网鉴黄主要分为三个阶段，第一阶段叫人肉阶段，主要通过人工识别的方式来发现黄色内容；第二阶段叫算法过滤阶段，以肤色识别算法过滤黄色图片开始成为主流；第三阶段叫深度学习阶段，因为纯肤色式地图片过滤已经难以担当鉴黄的重任，所以机器学习成为了新的主角。针对第三个阶段，智能相对论分析师（aixdlun）杨苏颖梳理了三种不同的智能鉴黄工种，分别囊括了音频、图像和视频三种形式。

首先是鉴定图片和视频的鉴定。鉴别黄色图片的过程主要有两步，第一步是用黄图的特点来定义一个机器可以识别的数学模型。第二步则是用大量满足定义的图片来进行样本数据的收集并将其用于机器训练。在岛国搜寻大量动作片的种子进行海量灌输之后，我们可以得到一个越来越精准的模型，从而让人工智能准确识别出某张图片是否为黄图。这是AI鉴别静态图片的一个简单流程。

那么AI对于动态图像又是怎么进行处理的呢？其实AI要对在线视频和直播这类的动态图像开展鉴黄工作，其原理与鉴别静态图片并没有太大的差别。只要在鉴别视频和直播的时候，人为地多加一个步骤把动态内容解码变成图片帧，剩下的工作就和静态图片处理大同小异了。

另外，如今伪ASMR的涌现要求AI在色情音频上的处理能力也必须跟上。在各种直播房间内，主播们更是可以直接以语言交流的方式与粉丝进行互动。所以，国内的一家名叫极限元的公司采用了一种叫CTC+LSTM组合的深度学习技术来识别色情音频内容。它可以分析语音的信息内容，从而判断出语音当中是否含有色情信息。

在鉴黄领域，AI的三管齐下显示了其要肃清黄色内容的决心，而且它也确确实实地减轻了人工鉴黄的压力。但是在现实当中上有政策，下有对策的戏码总是会不断上演，因此鉴黄的力度越大，色情的边界也就拓展地越快，自然AI鉴黄的难度也会越大。而这好像成为一个绕不开的死循环。

AI鉴黄可能暂时还hold不住软色情

最近软色情一词在网络上被频繁提到，成为一个关注度很高的话题。软色情的内容很软，好像广告软文一样，入侵的时候悄无声息。但是其所造成的伤害却很硬，足以让没有心智成熟的青少年沉溺其中难以自拔。AI进入鉴黄领域，势必要面对现在越来越活跃的软色情，但要如果真想要AI对软色情做出识别和判定却是一项难上加难的工作。

软色情的定义很模糊，它的定义是与硬色情对比得来的，指一些不暴露生殖器官的色情内容。如果把暴露生殖器官作为一个特点去识别哪些内容属于硬色情，那么这是一件相对比较容易的事情。但是我们却不能把不暴露生殖器官作为识别软色情的特点，否则所有不暴露生殖器官的内容都会被标记为软色情内容。所以这也就意味着软色情并不是一样容易被贴上具体标签的东西，它非黑非白，而是属于灰色，因此很难被公式化。

这就为人工智能鉴黄制造了一个难题。通常人工智能进行鉴黄首先需要建立一个“分类器”来将图片归类，但不幸的是，软色情的问题却没有那么简单。什么是软色情这个事并不好弄清楚。在B站的一些弹幕上，我们常常可以看到一群人对着视频当中的萝莉发弹幕，包括“跪舔”“硬了”之类的字眼。但是拿“跪舔”为例，有些人只把它当作一个比较夸张的网络用语，觉得无比正常。而有的人在这些字眼的刺激下却真的会产生生理反应，难以把控。

这些不同的反应主要是由于我们每个人色情刺激的阈值高低不一。所以，像“跪舔”这样的弹幕到底算不算是软色情的表现呢？这很难判定。扪心自问，软色情是一个很个人化的东西，它几乎可以是一切能够唤起自己对配偶之外的性欲的东西，而机器却不可能成为每一个人肚子里的蛔虫。

不仅是定义模糊难分类，软色情的传播渠道也开始朝越来越隐秘的方向发展。今年3月B站的“文爱”事件让语C群浮出水面。各种娇喘的音频，露骨的聊污在QQ微信群里肆意传播。在此基础上，选择私聊成为“文爱”对象的青少年也同样不在少数。

我们可以看到的是，全国最大的社交工具现在正在成为全国最大的软色情承载地之一，而这些社交工具对隐私的保护竟成为了软色情最好的保护伞。面对这些越来越隐秘的色情传播形式，AI要尝试去发现它们的存在实际上是一件非常困难的事情。

如果强行去打开这扇门，那么很有可能会触及到阅读用户隐私这条红线，对此，内容审核方难以把握，所以也就更难以下手。加之，人工智能对自然语言的识别程度现在还十分局限。常用的拆字法、首字母缩写法、取别称法、拼音代替法、形近字代替法等等也会让鉴黄工作变得更为复杂。

AI鉴黄堵住了人性的出口吗？

弗洛伊德的泛性论认为，性是一种本能力量。若受到压抑就会导致人得精神疾病。因此，色情内容的看客会说，AI鉴黄堵住了人性的出口。在美国，色情业的收入超过了哥伦比亚广播公司CBS、全国广播公司NBC和美国广播公司ABC三家收入的总和。营业额超过了所有职业橄榄球、职业棒球和职业篮球收入的总和，因此色情产业对人来说是一种刚需。

法国有一部叫《生吃》的电影曾对人的欲望做出讨论，电影女主角一家因为基因变异的问题受本能驱使不得不生吃人肉，这看上去非常残忍。但是仔细想想，吃人肉为什么一定得被定义成“野蛮”、“残忍”的代表，“吃人肉是错的”这样的道德标准又是从何而来？如果吃人肉是一种本能，那么本能是不是不能加以价值判断？

确实，本能不可以加以价值的判断。因为欲望是真实存在，并且与生俱来的。但是怎么对待自己的欲望却可以成为一门很重要的功课。如果我们对欲望视而不见，那么人就会麻木，压抑；如果我们任欲望横流，那么人最终会被欲望吞噬，成为怪物。欲望不能被杀死，但是也不能成为我们生活的主宰者。控制性欲、食欲、肉欲的道理皆是如此。所以，黄色内容需要正规、有序的引导，AI鉴黄不是在堵住人性的出口，而是在调控欲望的尺度。

智能相对论（微信id:aixdlun）：深挖人工智能这口井，评出咸淡，讲出黑白，道出vb深浅。重点关注领域：AI+医疗、机器人、智能驾驶、AI+硬件、物联网、AI+金融、AI+安全、AR/VR、开发者以及背后的芯片、算法、人机交互等。