用户越发关注隐私,广告算法如何使用个人信息?
2015-07-12 09:15

用户越发关注隐私,广告算法如何使用个人信息?

2015 年 5 月 6 日,南京市中级人民法院对“百度用户朱烨隐私权纠纷案”作出终审判决,撤销南京市鼓楼区人民法院一审判决,判决驳回原告朱烨的全部诉讼请求。此案一审法院曾判决朱烨胜诉,原告朱烨认为百度在未经其知情和选择的情况下,利用网络技术记录和跟踪她搜索的关键词,对其浏览的网页进行广告投放,侵害了其隐私权,要求法院判令停止侵害。但百度上诉后,南京市中级人民法院近日在终审判决中推翻了一审的决定,驳回朱烨的全部诉讼请求。


上海财经大学法学院副院长胡凌在《财新》撰文指出:“朱烨的挑战虽然不成功,却直指新经济要害,为我们展示出新经济模式同作为生产资料的用户信息之间的关联。要想解决这一困境,法律将不得不承认个人信息的财产权利,从而使互联网企业在使用这些信息时变得更加透明。”


信息时代,如何让互联网巨头利用个人信息的做法更加透明?也成为许多学术机构的研究课题。


本文来自 MIT Technology Review,虎嗅编译:


互联网公司记录用户的在线使用习惯,并利用数据推送广告的事情,已经是人尽皆知了。但究竟这些用户数据被使用的细节,仍旧不为人所知。就在上周,一篇新发布的论文揭示了某些互联网公司设计的广告系统算法是如何运作的。对许多人来说,内幕令人震惊。


卡耐基梅隆大学 (Carnegie Mellon University) 国际计算机科学中心 (International Computer Science Institute) 的研究员们设计了一种工具,能够探测 Google 在第三方网站上的广告定向 (ad targeting)。研究结果发现,被 Google 系统认为是男性求职者的互联网浏览用户,和同等情况下的女性用户相比,在下次浏览某一新闻网站时出现一份高薪管理职位招聘广告的机率,要高出许多。


研究人员还发现,被称为“广告设置”的 Google 广告信息透明度工具,也就是该公司用来让用户自己查看、编辑“兴趣爱好”的设置工具,并没有始终体现出该公司用来定位用户所使用的潜在敏感信息。比如,浏览目标受众是有药物滥用问题人群的网站,会触发一大批和康复治疗项目有关的广告,但是在 Google 的广告信息透明度页面上没有任何变化。

Screen shot 2015-07-12 at 1.01.57 AM.pngGoogle 的广告设置页面


导致这些特殊情况发生的原因尚不清楚,Google 的广告服务系统是非常复杂的。Google 使用其搜集的数据进行目标人群的广告定位,但是广告采购者会基于兴趣爱好的人口分布情况做一些自己的调整,也有可能基于自己搜集的用户在线数据,在某些类型的广告上做一些额外的用户定位。虽然这些案例中的情况并没有违反任何美国的隐私保护规定,但是 Google 宣称的用户隐私条款中明文禁止搜集用户“健康状况”方面的信息用于广告定位。卡耐基梅隆大学副教授达塔 (Anupam Datta) 表示,这些问题说明,需要设计更多工具,分析、揭示这些互联网公司的广告系统是如何对用户进行区别对待的。


“我认为这次的研究结果表明,在目前广告行业生态的一些公司中,某种歧视性的现象开始出现,透明度缺失,”达塔说道,“这是站在社会整体角度的一种担忧。”他表示,像 Google 这样规模的广告系统,会影响到人们所获取的信息,甚至有可能影响到他们的决定,了解这些公司如何使用我们的个人数据,是非常重要的。


该项目的研究员们已经开始与微软公司合作,对该公司的 Bing 搜索引擎进行调查,寻找在广告定位过程中潜在的有问题模式。达塔透露,运营在线广告网络的互联网公司甚至有时也不是很清楚系统是如何对用户进行推论的。达塔和他两位卡耐基梅隆大学的同事,于上周四在费城举行的隐私加强技术研讨会 (Privacy Enhancing Technologies Symposium) 上发布了他们的论文研究。


研究人员表示,去年曾就此研究结果联系了 Google,但是该公司并没有官方回应。但今年六月,研究人员发现 Google 在其广告设置页面加入了免责条款。该页面显示的“兴趣类别”现在被描述成只控制“你看到的某些 Google 广告”,不包括那些第三方使用自己数据后的广告。达塔表示,这一调整极大地限制了 Google 透明度设置的有效性。


“广告主能够选择去定位他们希望达到的受众,我们有相关的政策,基于兴趣的广告类型是被允许的,” Google 发言人 Andrea Faville 在邮件中说到,“我们通过使用‘为何是这个广告’ (Why This Ad) 提示和‘广告设置’功能,向用户提供透明度,此外还有退出‘基于兴趣展示广告’的选择。” Google 目前正在对该项目的研究方法进行分析,并试图理解其研究结果。


达塔等人设计的研究工具,通过发送成百上千条机器处理过的 Web 浏览请求,在网络上留下了事先准备好的信息踪迹,这样广告定位系统就能推测出某种兴趣取向或浏览活动。当每一条自动化的浏览请求在访问使用 Google 广告系统的新闻网站时,该工具会记录下有哪些广告结果被展示出来,并记录下广告设置页面的改动情况。在某些试验中,页面会被编辑,以便寻找不同广告定位方式的区别,比如浏览用户性别不同的情况。该工具会自动标识统计数据上的巨大差异,也就是在使用不同兴趣参数或用户位置参数时,广告结果所表现出的不同。


哥伦比亚大学副教授罗克珊娜认为,目前这种研究方法得到的结果更多是象征意义。“你没办法得到特别大的结论,因为我们还没有进行大量的分析,这些案例也可能是少数特殊情况,”她说道,“我们现在需要的是能够以更大规模研究这一问题的基础架构和工具。” 她表示,主张隐私保护的民权组织和政府监管部门需要跟上互联网公司开发利用数据的节奏,仔细观察算法如何跟踪、记录用户行为尤其重要,特别是在展示广告和调节产品价格方面。


去年美国白宫曾发布了一份有关“大数据”的报告,其中特别提到:


“个人信息在住房、信贷、就业、健康、教育和消费等领域的应用,一直以来都受到公民权利的保护,数据分析技术的出现可能会让这种保护逐渐式微。”


回到本文最初的“百度用户隐私权案”,胡凌教授的评论文章在谈到判决结果时指出:“为了追求形式上的法治,法院向技术和新经济妥协了,默认了免费使用用户信息的商业模式。”他同时呼吁:“要彻底解决未来的难题,法律有必要承认个人信息的财产权利,进而对互联网公司的行为加以约束。”

如对本稿件有异议或投诉,请联系tougao@huxiu.com
正在改变与想要改变世界的人,都在虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定