题图来自视觉中国
机器学习,也能当“鉴黄师”?
食色性也,在没有分级制度的当下,色情内容鉴别就变得非常重要。
最开始人们会用人工审核解决这一问题,互联网的普及让数据量大幅增加,全部依靠人力审核变成了不可能的事。
机智的人们想到用肤色识别算法过滤掉非黄色图片,余下的内容再进入人工审核,可以大大提升审核效率。
移动互联网时代的到来,视频、直播的爆发,数据量多到这种识别方式也无法承受,于是就有了机器学习“鉴黄师”。
对于机器来说,鉴黄就是让它给出一张图片是黄色图片的概率,再根据这个概率给出答案。
曾经被标记为黄色内容的图片,混合非黄色图片输入机器,通过学习大量标记数据,机器就能给出黄图概率。
再由人类设定阈值,进而给出“是”或“否”。
机器难以判断的图片,也会交由人工审核,确认后再度教给机器,让机器“鉴黄师”越变越聪明。
至于视频、直播,只要截取画面后再进行识别就可以。同样的方法也可以用来识别暴力、血腥内容,帮助减轻人力负担。