当算法能够左右西方选举
2021-06-13 07:05

当算法能够左右西方选举

本文来自微信公众号:探索与争鸣杂志(ID:tansuoyuzhengming),作者:王中原,原文标题:《王中原|算法瞄准如何重塑西方选举 ——算法时代的选举异化及其治理》,本文原载于《探索与争鸣》2021年第5期,题图:Unplash


2016年唐纳德·特朗普的意外当选和其后披露的“剑桥分析”丑闻,让人们注意到智能算法的强大威力,及其对选举民主的冲击。


2020年美国大选再次将算法瞄准和智能选举推向了新高度,新的算法科技和瞄准手段不断涌现,数据驱动的智能选举(data-driving elections)逐步取代传统的选举动员方式,加上新冠肺炎疫情导致线下竞选活动受限,使得虚拟世界的“算法空战”成为本届选举的主要形式。


特朗普团队和拜登团队仅仅用于脸书平台(Facebook)的政治广告精准投放花费,就分别高达9770万美元和8210万美元,数据和算法成为选举的核心竞争力。


最前沿的算法科技被淋漓尽致地运用到选举场域,政党、候选人、竞选团队、咨询公司、数据掮客(databroker)、算法服务公司、社交媒体平台等形成新的选举联盟,重塑着选举生态。


这些新变化不仅意味着选举策略和竞选方式的转变,而且对选举民主的内涵和根基构成新的挑战。算法时代的西方选举正在走向某种形式的异化,为我们观察和思考选举民主的危机及其治理提供了契机。 


西方正在进入智能选举的新时代,数据资源和算法技术开始重新定义西方的选举政治,选举不仅是政党政策主张之间的比拼和选民自由意志的选择,而且越来越成为不同政党和选举人在数据和算法领域的较量。最大限度地搜集和挖掘选民数据,运用智能算法对选民展开精准动员,引导选民行为以收割选票,成为算法时代新的选举方程式。


基于海量选民个体数据的算法瞄准,一方面拓展了竞选活动的形式,更加有效地传递选举资讯和智能化地动员投票,有助于提升选举民主的活力;另一方面加大了对选民心理和行为的操控,引导候选人分割和选择动员对象、掌控选民情绪、精准投放信息,以及“围猎”潜在支持者,这些都将危及民主的核心价值。


2020年10月22日,美国田纳西州纳什维尔市,美国总统特朗普和民主党总统候选人拜登举行大选前的最后一场电视辩论。

图片来源:视觉中国


算法瞄准和智能选举的兴起有着深厚的时代背景。


首先,西方竞争性选举政体正面临政党离散的压力,党员数目和选民的政党认同都显著下降,新的算法科技成为政党重新触达、联结和动员选民的得力工具。


其次,西方选举日渐走向个人化,候选人的个人特征和吸引力成为左右选举的关键因素,特别是在民粹主义盛行的大背景下,基于候选人的算法瞄准和选民动员成为竞选的有效手段。


再次,西方选举政治正在走向深度极化,党派竞争进入白热化状态,传统的竞选方式已经达到成效上限,通过新技术手段挖掘潜在选民和提升投票率成为选举交锋的新战场。


因此,算法瞄准并非简单的竞选技术革新,其背后是整个西方政治生态的转型。研究新技术环境下的选举政治,有助于我们把握西方政体的运行动态,反思技术密集型选举的局限,研判选举政治的发展方向。


本文将聚焦智能选举中的算法瞄准及其对选举民主的异化影响。


首先,梳理算法瞄准的基本概念和发展历程,分析发达民主国家智能选举的前沿动态。


其次,剖析算法瞄准的基本原理和技术过程,揭示选举中“算法武器化”的技术逻辑。


再次,阐释算法瞄准的政治后果,反思算法瞄准如何异化选举民主,动摇西式民主的基本前提、程序正义和价值目标,从而威胁民主政体的健康运转。


接着,探讨算法时代西方选举异化现象的治理路径,分析多圈层治理中不同主体的角色。最后,提炼本文的核心观点,展望算法时代西方选举政治的发展态势和未来的研究课题。


智能选举中的算法瞄准


锁定目标选民(voter targeting)是选举动员的核心策略,其目标是在竞选经费有限的条件下有效地动员尽可能多的选民参与选举活动(包括投票、捐款、集会、担任志愿者等)。


传统的选举动员方式较为粗糙,政党或候选人根据掌握的选民分布信息和历史投票情况,借助特定的媒介和工具展开动员,常用的手段包括打电话、发邮件、电视广告、扫街拉票等,锁定对象多在群体层面。


随着算法时代的到来,数据资源的积累和算法科技的精进为选民动员提供了新的手段,使得聚焦选民个体的精准动员成为可能,基于算法的政治瞄准(political micro-targeting)应运而生。



算法瞄准(algorithmic micro-targeting)是指“运用数据分析识别个体的具体兴趣,然后创制个性化的资讯内容,预测这些资讯的影响,然后将这些资讯精准投放给相关个体”。


算法瞄准起初为商业营销手段,即根据个体特征、消费记录、日常喜好和社交网络等数据对客户进行画像,进而投其所好地为客户推荐广告和产品。


近年来,算法瞄准越来越多地运用于政治领域,用以建立选民关系和动员选举投票,并在选举实战中取得突飞猛进的发展。


算法瞄准的核心是数据而非选民,其基本假设是单个或几个数据点(data point)无法准确反映选民的偏好,需要收集海量的、多维的、各领域的选民数据才能构建完整的选民画像。


区别于传统的选举方式,算法瞄准依靠大规模的选民个体特征数据和行为数据来对选民进行精准划分和归类,然后依托算法识别选民的人格特性和偏好立场,基于此向其推介个性化定制的选举资讯和动员活动,并通过预测、试验、反馈、迭代等过程不断优化,从而达到最大化影响选民投票意愿和投票行为的目的。整个竞选过程由数据驱动,通常被瞄准的选民并不知道其个体数据是如何被收集、分析和使用的。


算法瞄准是大数据时代智能选举的核心技术,近年来在西方各国选举中得到不断发展。早在2004 年美国总统大选中,共和党候选人乔治·沃克·布什就开始运用数字技术辅助线下竞选,收到良好的效果。


民主党在输掉2004年选举后,开始着力推进竞选技术的革新,2008年大选中奥巴马团队创新运用各种数字化手段来募集资金和动员选民,“数据驱动的选举”初见雏形。


然而,真正意义上的智能选举出现在社交媒体广泛兴起背景下的2012年美国大选,奥巴马团队首次大规模运用脸书等社交媒体平台对选民展开瞄准式动员,2012 年选举也因此被描绘为“大数据选举”(the big data election)。彼时,大数据为选举赋能,尚被视为一种积极的选举创新。


然而,情况在2016年大选中发生了变化,特朗普团队雇用第三方公司大规模收集选民个体数据,通过心理测绘和人格分析操控选民认知和行为,在社交媒体投放大量定制化的竞选广告以诱导选民的投票偏好,对大选结果造成重要影响。特别是“剑桥分析”丑闻爆发以来,社会各界对智能选举中的算法瞄准开始重新审视。



相较于2016年,2020年美国总统大选再次将智能选举推向极致,并带来了诸多新变化:


首先,新的数据生态系统形成,竞选团队与数据和媒体产业高度融合,大量数据掮客公司、智能广告公司、软件开发公司、媒体咨询公司、新媒体平台等涌入选举市场,构成“选举数字军团”。


其次,算法科技高度纯熟,对选民的识别精度进一步提升,商业营销中最前沿的用户画像技术和人工智能算法被移植到选战当中,帮助候选人迅速锁定潜在支持者,开展个性化的动员攻势。


再次,竞选团队自行开发数字工具收集选民数据,运用物联网、蓝牙定位、授权共享等技术拓展支持群体,并借助“图计算”和“私域流量”进行“关系式动员”(relationalorganizing),数据团队在竞选组织中开始扮演核心角色。总之,选举中的算法瞄准技术已经相当成熟,掌控尽可能多的选民数据以及运用最先进的算法技术进行精准动员成为影响选举胜负的关键。


算法主导的智能选举也蔓延到其他西方国家,但由于各国制度环境和法律体系的差异,呈现出不同的发展态势。


在加拿大,保守党在2006年大选中就通过建立“选民信息管理系统”来识别和动员支持者,2015年大选中三大主流政党都组建了选民数据库,运用算法瞄准技术动员民众。


在英国,2015年大选中保守党采取了美国式的算法瞄准策略,通过大规模采集和挖掘选民个体数据展开精准动员,帮助其赢得了选举。


2016年英国脱欧公投中,脱欧派阵营通过雇用数据分析公司对选民施加心理诱导,影响了公投结果。在荷兰,主流政党和激进右翼政党在2017年大选中都加大了对数据分析和社交媒体广告的投入,通过个性化的隐形信息推送(dark posts)影响选民投票行为。


在德国,2009年联邦大选中社民党(SPD)和基民盟(CDU)开始借助大数据分析指导线下竞选活动,虽然起初收效甚微,但更加复杂的算法瞄准在2013年和2017年联邦大选中得到推广。


总之,无论是在多数决制的国家(例如美国和英国),还是在比例代表制的国家(例如荷兰和瑞典),算法瞄准技术都在重塑选举政治生态。




算法瞄准的基本原理和技术过程


传统选举依赖民意调查的动向来部署竞选策略,然而随着民调频繁失准,机器学习和人工智能算法成为预测和干预选民行为的重要竞选“武器”,围绕算法的“军备竞赛”成为影响选举成败的关键。


算法瞄准并非铁板一块,其涉及不同的参与主体,使用不同的数据资源,运用不同的工具,瞄准不同的对象。然而,算法瞄准的基本原理是一致的,其核心技术过程可划分为三个步骤,理解它的基本原理和技术过程,有助于我们研判其对选举民主的影响:


(一)选民数据采集和预处理


算法瞄准首先需要采集海量的选民个体层面数据,数据资源通常来自“公共数据”和“私人数据”。


公共数据包括人口普查数据、地理信息数据、选民注册数据、历史投票数据、选举捐款数据等。例如,美国各州建立有注册选民数据库,并允许政党获取注册选民的姓名、年龄、族裔和历史投票情况等数据,这些数据有助于政党迅速掌握选民群体的特征和分布情况。


私人数据包括选民个人的网络行为数据、消费数据、生活方式数据、财务数据、联系方式和社会交往数据等。


以网络行为数据为例,社交媒体平台掌握大量的用户行为数据,包括关注、点赞、分享、转发、评论以及好友关系等,竞选团队既可以自己爬取这些数据,也可以通过购买服务、投放政治广告等形式予以利用。


就消费数据而言,各大购物、支付和邮寄平台拥有海量的用户交易数据,包括商品搜索记录、消费历史、交易凭证、信用情况、客户评价等,数据掮客公司会买卖此类数据,用于更加精准的用户画像。生活方式数据通常包括行动轨迹数据、运动数据、作息数据、健康数据、订阅数据、娱乐生活数据等,这些数据有助于研判选民的人格特质和政策倾向。


财务数据包括选民的收入和支出、住房贷款、股市投资、社会保障等数据,这些数据有助于预测选民对经济政策的敏感度。联系方式和社会交往数据包括选民个人的地址、电话、邮箱、社交账号等数据,以及选民的通讯录、联系人和交际圈等数据,前者便于与选民取得直接联系,后者可以用于拓展潜在支持者。


政党或竞选团队既可以自己采集上述数据(特别是公共数据),也可以通过数据掮客购买。例如,美国共和党自2011年以来就依托Data Trust平台进行数据收集和交换,该平台宣称拥有美国 50个州3亿人的个体数据,每个观测个体有2500 个数据点。


民主党起初对此类数据收集活动持保留态度,但2016年选举受挫迫使民主党在2020年大选前也成立了类似的数据平台,加强选民数据的采集、共享和交换,助力本党选举。


此外,在2020年总统大选中,共和党和民主党的候选人都使用了专属的竞选APP自主采集数据。


例如,在注册特朗普的竞选APP时,需要提供姓名、手机号、邮件、邮政编码等数据,同时授权蓝牙连接功能,该 APP 帮助共和党采集到 4000 余万选民的个体数据,其蓝牙功能可以与遍布大街小巷的竞选广告牌中的内置芯片进行物联网,从而追踪选民的交际圈。


购买第三方数据也是常态,当前西方国家(特别是美国)已经形成规模庞大的数据交易市场,除了IBM、Google、Facebook等大公司之外,从事政治数据交易的著名掮客公司包括Experian、i360、Aristotle、L2等。


以Experian公司为例,其汇聚了1.26 亿美国家庭(3亿多人口)的数据,这些数据覆盖过去 50 年,数据内容包括个体人口学特征、消费习惯、生活方式、兴趣爱好等,该公司还宣称掌握85%的美国家庭住址资料和5亿个电子邮箱,可以精准地触达动员对象。


数据丰富度和数据质量是决定算法瞄准成效的关键要素。


竞选团队在采集和购买数据后,通常会对来自不同渠道的数据进行清洗、匹配、合并和插补等预处理,构建数据库以备后续环节使用。不同来源的数据在格式、变量、记录方式、缺失值等方面都存在差异,按照个体身份信息(如姓名、性别、出生日期等)进行匹配和合并是常用的做法。


同时,按照一定规律对数据进行插补也是提升数据质量的必要步骤,例如通过姓名推测族裔,通过宗教活动场所插补信仰情况等。


此外,部分数据(特别是网络行为数据、消费数据、社会交往数据)需要在竞选过程中不断更新,以实时把握选民动态。通过历届积累,政党通常能掌握大规模的选民数据,形成丰富的选举数据资产。


(二)选民分类、模式识别和算法预测


算法瞄准的第二个关键环节是运用分类建模对选民进行精准画像,识别选民特征与其投票行为的隐性关联模式(hidden patterns),并进行算法测试。


首先,竞选团队会对所掌握的海量选民数据进行深度挖掘,借助统计模型和机器学习算法分析选民的人格特征、情感偏好、心理结构、政策倾向和政治态度等,完成对选民的政治画像和精准分类。


根据目的不同,分类建模的具体算法也有差异。如果是为了推广某项具体的政策纲领,需要提取与该政策相关的特征变量进行选民分类。


例如,美国共和党为宣传其持枪政策,可以从枪支购买和维修记录、枪械协会的会员信息、社交媒体的相关评论数据中提取特征变量对选民进行分类或赋分;民主党想推广其气候政策,可以从清洁能源购买数据、生活方式数据中挖掘相关特征进行选民分类或赋分。


如果是为了对选民进行情感动员和心理干预,需要按照选民的人格特质和心理状态进行分类。


常用的算法是根据大五人格理论对选民进行心理测绘(psychometric profiling),以判断选民的人格倾向、认知结构和心理轨迹,从而理解其投票决策方式和触发因素。近年来,随着情感分析算法日渐成熟,运用社交媒体数据识别选民情绪和投票偏好成为流行方式。


心理测绘(psychometric profiling)


其次,除了运用分类算法进行选民画像,还需借助预测算法分析选民特征与投票决策之间的隐性关联模式。


例如,有研究通过分析全美200多个城市的5000万张谷歌街景地图数据发现,轿车较多的街区更倾向于支持民主党,而皮卡车较多的街区则更多支持共和党。数据分析公司HaystaqDNA用卫星照片数据识别安装太阳能电池板的家庭,指导民主党向这些家庭推销环保政策以动员投票。


诚然,这些关联模式只是特征变量之间的某种相关性,缺少因果解释,但是在指导竞选活动时,相关性就已经足够,候选人只求按照该关联模式可以实现精准动员,无需深究其间的因果机制。


预测算法除了挖掘可观测对象的投票行为模式外,还可以预测类似不可观测对象(lookalike audiences)的活动,这意味着即便数据库中没有某个选民的数据记录或者数据记录极不完整,算法同样可以根据对现有数据中相似选民的分析预测该选民的投票倾向。


(三)选民瞄准和个性化动员


算法瞄准的最终落脚点是对选民个体施加政治影响。


竞选团队根据所识别的选民类型和特征关联模式,运用机器学习算法定制个性化的动员策略,并不断优化瞄准精度,实现对支持者的精准动员和对竞争者的精准打击。


选民瞄准可以划分为不同类型,包括基于议题的选民瞄准,即向选民兜售某种政策立场或攻击对手的政策立场;基于候选人的选民瞄准,即推销己方候选人或攻击对方候选人;基于虚假信息的选民瞄准,即向选民投放选举相关的虚假信息。


不同于传统大水漫灌式的电视广告轰炸,算法瞄准精准对人,一人一策,根据选民画像进行定制化的信息推送和个性化的游说动员,既可以提升动员效率又可以节约竞选成本。


政党/候选人通常会启动全媒体的选民触达策略,根据选民使用习惯,采用社交媒体、在线订阅、电子邮件、搜索引擎、手机短信、邮寄、电话、电视、广播、播客等形式向选民传递竞选资讯,并根据对象调整不同的话语策略和投放时间,以最大限度地提升动员效率。 


为了优化瞄准精度,竞选团队会在大规模信息投放之前进行多轮测试,常用的手段包括“A/B”测试(“A/B”testing),即通过人工智能算法编制对照的信息内容和投放形式,以测试哪种更有效。


例如,编制不同版本的电子邮件,在标题、措辞、内容编排、回应功能上设置差异,然后将该邮件发送给一定样本的目标群体,监测哪种形式的邮件最有效、哪类选民的回应率最高,进而不断优化邮件瞄准方式。


常用的个性化动员方式还包括社交媒体广告、定制化短信等。基于心理测绘的政治广告推送,通过挖掘选民的人格特征、价值态度与投票决策的关联模式,强化对选民的心理攻势,以影响其投票倾向和意愿。


个性化的短信联络(P2P texting)通过智能算法编制具象化的短信息以抓住选民注意力,并依靠志愿者同选民建立人格化的私人联系,推动资讯的关系式传播。


2020 年大选中,特朗普团队将定制化短信作为关键竞选武器,精准推送了约10 亿条攻击性短信和虚假信息。


个性化动员有两个核心目标:一个是督促支持者采取某种行动,例如投票、捐款或志愿服务;另一个是改变选民的支持态度和投票行为。虽然选举实践证明后者难度较大,但是随着算法技术的精进,算法瞄准将在选举中发挥更大的影响力。


算法瞄准的政治后果 :选举民主的异化


算法瞄准将产生一系列的政治后果,影响西式民主的程序正义和结果正义。


算法瞄准起初代表着选举技术创新,是大数据时代智能选举的新模式,不仅能够提升选民政治参与的热情,而且可以让政党 / 候选人更加了解选民的诉求,提升政治回应性。


然而,随着算法科技的无限制使用,算法瞄准渐渐走向民主政治的对立面(如图1),主要体现在:


(1)算法瞄准通过信息操弄建构选民的选举偏好和操控选民的投票行为,导致选举从“选民控制政党/候选人”转变为“政党/ 候选人控制选民”。


(2)算法瞄准强化了党派立场,消解了交叉认同(cross-cutting cleavages),导致消极竞选和政治极化。


(3)算法瞄准筛选或压制选民,导致政治代表性偏差,选举承诺的碎片化引发政府回应和选民问责的困难。


总之,如果缺乏有效治理,算法瞄准将异化选举民主的前提、过程和目标,使得通过投票聚合选民偏好从而选出政府回应选民需求并接受选民问责的“民主链条”出现裂痕(如图1),威胁民主政体的健康运转。




(一)信息操弄和选民操控


民主选举得以有效运转的前提是选民能够在开放的信息环境和政策市场里自主地作出投票决策,免于外在力量的干预和操弄。算法瞄准打破了这一前提,让政党/候选人有机会控制选民的信息获取和投票行为,选民被异化为一组数据构成的投票工具。


首先,算法瞄准导致信息操弄。


一方面,政党/候选人在选民不知情的情况下采集了海量的选民个体信息,这些数据能够覆盖几乎全体选民并涵括成百上千个特征维度,从而对选民实现超级精准画像(super profiling)。而当选民成为数据组成的“透明人”,他们的任何活动都可能被追踪和记录,被用于算法瞄准,而选民通常并不知道自己的哪些数据、正通过什么方式被政党/候选人所掌握和利用,导致“监控式资本主义”(surveillance capitalism)。


更严重的是,如此运用算法瞄准会让选民被物化为某种“特征集合”:从此,竞选活动面对的不再是一个个活生生的选民,而是一个个冷冰冰的数据点。


另一方面,政党/候选人可以运用算法对选民进行“分而治之”,针对不同类型的选民“投喂”不同信息,选民所接受的选举资讯是根据其喜好、特征、阅读习惯和政治立场所精心编制的。


民主需要“明智的选民”(informed electorate),但算法瞄准导致信息自由流通受阻,信息市场被高度扭曲,每个选民都生活在算法编织的信息“滤泡”(filter bubbles)当中。


此外,选民对这些个性化信息的回应(点击、转发、回复等)再次变成新的数据,帮助算法瞄准不断优化,形成互动式的算法升级螺旋,进一步固化信息茧房。算法瞄准赋予政党/候选人和第三方算法公司超出常规的权力来影响选民的态度和行为,并且其运行极其不透明,形成难以监督的“算法利维坦”。


其次,算法瞄准导致选民操控。


民主选举必须基于选民的自主决策,然而在扭曲的信息环境下,选民偏好不是自主的而是被建构的。


民主选举的过程不再是选民根据自己的利益和偏好来选择政党/候选人,而是政党/候选人选择和驯化支持者,并通过控制信息流通和塑造非理性的政治偏见来“围猎选民”(hunt for voters)。类似于选区操控(gerrymandering)通过将选民“分解”和“打包”在不同的地理选区内来制造竞争优势,算法瞄准通过将选民“分解”和“打包”在不同的信息茧房中来操控投票行为。


认知心理学认为任何人都存在“决策脆弱性”,算法瞄准正是利用了选民认知局限来影响其投票行为。


无论选民同意与否、有意识或是无意识,算法都可以操弄选民的希冀和恐惧、喜好和厌恶、欢欣和愤怒来进行瞄准式动员,不断激活选民的某种心理范式和神经反应,形成结构性刺激以左右其决策。


智能选举构建了一个越来越庞大的复杂信息系统,选民的认知、心理、情绪和判断能力被算法所影响,无法作出自主、独立和理性的决策,甚至没有能力察觉和反思自己的决策。


结果是,选民决定投票或不投票以及投给谁看似是选民自己的选择,其实该选择早就被算法瞄准所操控,并且这种操控是隐匿的和持续的。选举政治的制度逻辑是选民可以通过选票控制政党/候选人,但算法瞄准却将选民异化成被控制的对象。


(二)消极竞选和政治极化


民主选举要求政党/候选人通过良性竞争赢得选民支持,竞选的过程也是开展全国性公共对话的过程,通过议题论辩和理性沟通促进交叉认同。算法瞄准打破了这一过程,数据和算法被“武器化”(weaponize),导致政治对抗升级,加剧消极竞选和政治极化。


首先,算法瞄准导致消极竞选。


智能选举时代算法科技成为决定胜负的关键,将算法运用到极致是所有政党/候选人的策略,这就使得算法的各种极端运用手段开始流行,包括推送虚假信息、传播阴谋论、污名化宣传、制造仇恨、歪曲事实等消极竞选方式。


为了追求选举利益最大化,政党/候选人会通过同质信息巩固支持阵营,运用虚假信息分化敌对阵营,算法帮助实现精准动员和精准打击,针对选民的不同特质进行高度个性化的洗脑和游说,并且毫不顾忌信息真实性。


此外,暗黑手段大行其道,社交机器人可以根据算法指示精准高效地向选民分发假新闻链接和污名化短信,并根据反馈调整推送策略。


由于算法瞄准是一个过程黑箱,外部并不知晓政党/候选人对哪些人传播了哪些虚假信息,无法进行事实核查和信息纠偏。加之虚假信息的传播速度、深度和广度惊人,消极竞选的影响被不断累积和放大,从而误导选民。


消极竞选导致选举生态恶化,首先采取这些消极手段的党政/候选人会获得高额的“算法红利”,并带动其他政党/候选人跟进,形成“算法军备竞赛”。此外,第三方算法公司出于盈利考量,也会不断升级智能算法,激化恶性竞争。


其次,算法瞄准加剧政治极化。


第一,算法瞄准按照特定的党派意识形态展开动员,党派割裂线在信息操弄下被不断触发和强化,超过其他任何社会认同,或者将其他认同吸附到党派认同当中,造成党派极化。


第二,算法将选民切割为不同类型的子群体,对每个群体构造不同的信息环境,从而形成高度“部落化”的认同结构。算法瞄准通过虚假信息、政治攻击、选择性动员等不断激活党派认同边界,强化认同群体的组内抱团和组间排斥,不同“部落”之间缺少开放理性的对话,加剧了社会撕裂和认同对抗,造成群体极化。


第三,算法瞄准拆解了信息多元性,强化了选民个体的单维特性(o1ne-dimensionality),其人格、情感、心理和情绪被算法捕捉并放大,选民越发缺少反思和沟通能力,只能接受契合自己立场的观点和信息,而罔顾事实和真相,造成个体极化。


上述党派极化、群体极化和个体极化相互作用、彼此强化,不断消解交叉认同,催生整体政治极化。更为严峻的是,算法瞄准并非一次性行动,而是贯穿选前、选中和选后的整个过程。算法使得西方选举成为“全周期竞选”(permanent campaigns),数据收集、选民追踪、算法监控和瞄准式动员无时无刻不在发生,这将加剧政治极化的强度和烈度。


(三)政治代表性偏差和“回应 - 问责”失灵


民主选举的目标是实现政治代表性和有效的回应与问责,让不同的利益和声音得到平等对待,运用选票压力督促政府回应民众诉求,并惩罚不守承诺的执政者。算法瞄准模糊了这些目标,筛选或压制选民导致政治代表性偏差,碎片化承诺引发政府回应和选民问责的困难。


首先,算法瞄准导致政治代表性偏差。


政党/候选人借助算法将选民分割成不同特征组合,根据选民画像和心理测绘来判断选民的投票意愿和偏好,但并不是所有的群体都会被“瞄准”,政党/候选人会选择性地精准动员一部分人而有意忽略另一部分人。如果算法预测表明某些民众无论如何都不会参与选举或者不可能改变投票倾向,那么这部分选民将被排除在算法瞄准的序列之外。


同时,政党/候选人也会运用算法来压制选民(voter repression),特别是消解对方选民的投票几率和意愿。


例如,2016年美国大选中,特朗普团队曾瞄准摇摆州的非洲裔选民,向350万人推送了攻击希拉里的负面广告,以压制非洲裔选民的投票意愿。被忽略和压制的选民,其诉求和立场将被边缘化,无法平等地反映到政策议程当中。


此外,数据和算法是昂贵的政治资产,政党/候选人必须投入大量的资金、组织专门的团队、经过常年的积累才能把握先机,这有利于强大的主流政党,代表少数群体利益的弱小政党将被挤出竞争舞台。


同时,掌握数据资源和算法科技的第三方平台、数据掮客和政治咨询公司在选举中越来越有影响,其商业利益和话语权力在当选政府中拥有举足轻重的地位。一方面是部分选民群体和弱小政党代表性的丧失,另一方面是科技公司影响力的扩张,两者都将导致政治代表性偏差。


其次,算法瞄准引发回应与问责失灵。


竞选和执政是一个承诺和守诺的过程,然而在瞄准式动员当中,政党传递给选民的信息是高度个性化和碎片化的,面对不同的选民,强调不同的议题和承诺不同的方案,缺乏始终如一的政策叙事。每个选民所看到的是不同版本的政党形象,选民并不知道其关心的事项在整个政党议程中的优先级,也不知道围绕该议题有哪些不同的政策立场和解决方案,最终很可能出现当选政府无法满足其期许的局面,选民也很难就其个体诉求向政府问责。


这种状况一方面是因为当点对点动员更加有效时,政党将致力于讨好选民的个性化诉求,而忽略宏观和长远的政治规划。当竞选被微观算法所绑架,缺乏统一的政治纲领和政策排序,这便导致承诺和责任的模糊化,增加了回应和问责的难度。


另一方面,算法瞄准将引导选民关注个殊化需求,而对关系国计民生的重大议题失去兴趣,长久将形成选民与政党/候选人之间的私人庇护关系(patron-clientelism),损害回应和问责的公共性。此外,算法瞄准通常是在隐秘环境下进行的,通过非公开渠道传递的选举承诺,其透明性和可追踪性较差,很难实现有效的回应和问责。


算法瞄准的多圈层治理


算法瞄准将产生一系列负面的政治后果,导致选举民主的异化。如何治理智能选举中的算法失范,是摆在西方各国面前的紧迫议题。


算法瞄准涉及不同的利益主体,其治理过程也需要多方参与和相互制约,从而构建多圈层的复合治理结构:在制度圈层需要国家法律规制;在舆论圈层需要社会主体监督;在竞选圈层需要平台治理和政党协作;在投票圈层需要公民教育(见图 2)。


然而,不同主体对算法瞄准的认知、理念和需求存在较大差异,在如何把握言论自由与个人隐私之间的边界、算法经济和权利保护之间的张力、竞选效率与政治伦理之间的平衡等问题上尚未形成共识,加之各个国家和地区的政策不同,影响了当前算法治理的整体绩效。







首先,在制度圈层,算法瞄准的诸多政治风险无法在传统的法律框架内得到有效治理,需要新的法律规制。


近年来,特别是“剑桥分析”丑闻爆发以来,欧洲和北美各国纷纷推动相关立法。总体来说,欧洲走在算法治理的前列,采取了更加干预主义的治理策略。


例如,英国议会在倡导《个人信息用于竞选活动的行为守则》,并成立了跨党派小组推动相关选举法规的修改。欧盟推行《通用数据保护条例》,加大保护数据安全并规范个人数据的采集、传播和使用,其重要目的之一就是控制算法瞄准和虚假信息,保障选举公正。


此外,欧盟还要求谷歌、脸书、推特等互联网公司签署了《虚假信息行为守则》,打击基于数据的政治操弄。


德国《联邦数据保护法案》(Bundesdatenschutzgesetz)规定政党只能收集其党员或者与该党有密切往来的公民的数据,且严禁收集有关选民族群背景、政治立场和宗教信仰的数据,相关数据在完成特定用途后必须删除,严禁长期储存。


法国国家信息自由委员会规定,使用社交网络开展选举动员时,必须征得选民的同意并告知其数据收集和使用的方式。


相较欧洲,美国的算法瞄准政策较为宽松,目前尚未颁布类似严格的个人数据保护法规。虽然有议员提出了“禁止瞄准式政治广告法案”(BanningMicrotargeted Political Ads Act)和“诚信广告法案”(The Honest Ads Act),但是鉴于美国宪法第一修正案对言论自由的保护,政界和商界存在强大的反对力量抵制国家的过度管控。


总体来说,法律规制相对于算法瞄准的迅猛发展明显滞后,同时容易陷入多方博弈的僵局。此外,算法治理不能依赖总体性的数据保护条例,还需对具体的选举法、政治广告法、选举资金法等进行配套修改,形成法律治理系统并确保其执行,这对很多国家来说是不小的挑战。


其次,在竞选圈层,平台治理和政党协作在算法治理中尤为重要。


(1)平台治理。


平台公司不仅是海量用户数据生成和存储的主体,并且是算法服务和政治广告业务的供应商。脸书、谷歌、推特等平台公司掌握强大的数据权力,其自我治理是优化选举数字生态的重要手段。


基于2016年美国大选的深刻教训,谷歌公司已经禁止在其平台对选民进行瞄准式信息推送,对有可能对选举过程产生负面影响的虚假资讯开展了严厉打击。


推特公司也试图全面禁止政治营销,主张政治信息不能买卖,通过隐匿、删除或限制阅读等方式治理选举虚假信息,对可能产生误导的政治资讯附加警示。


然而,脸书虽然宣称严禁使用其平台进行选举操弄,但是拒绝禁止算法瞄准,其年度政治广告收益甚至高达36亿美元。


总之,当前平台治理还面临诸多困境,虽然社会舆论、国会听证和相关法规给平台公司施压,但是它们的商业利益和政策立场使得真正的平台治理步履维艰。此外,科技公司过度干预内容生产也招致诸多违宪质疑。


(2)政党协作。


作为竞选主体的政党和候选人也需参与到算法治理当中,例如不同政党可以就竞选伦理达成共识,出台最佳操作指南;约束提名人的算法行为,规范选举资金使用和政治广告投放,避免陷入“算法军备竞赛”;推动跨党派的立法协作,通过法治手段管理平台公司和竞选行为。


政党/候选人也应该管理好竞选团队,在选民数据采集、虚假信息传播、瞄准式动员等方面做好自我约束,维护良性的选举文化。诚然,在政治极化和民粹主义日趋严重的今天,依靠政党和候选人的自律进行算法治理显得尤为困难。


再次,在舆论圈层和投票圈层,社会监督和公民教育在算法治理中发挥着重要功能。


(1)社会监督。


算法瞄准呼唤媒体记者、非政府组织、学术界等社会力量的外部监督。


从事选举报道的调查记者可以揭示算法瞄准乱用的丑闻,通过媒体曝光警示和教育公众;从事事实核查的非政府组织(fact-checkers)可以核验算法推送的资讯是否存在事实错误和信息误导,及时澄清误解,引导民众对所接收的资讯作出理性判断 ;学术研究可以从政治学、法学、伦理学、传播学、心理学和计算机科学等跨学科的视角研讨和反思算法瞄准的应用和局限,对其发展趋势作出研判,从专业角度提出治理方案。


(2)公民教育。


公民个人作为选举决策的主体和算法瞄准的对象,也须承担相应责任。


一方面选民需要意识到自己是被“瞄准”的对象,接收的信息是算法过滤的,并提升甄别和反思能力,拒绝参与虚假信息的“共同生产”;另一方面积极参与公共空间的协商对话,除了关注同温层的观点,还要认识到其政策主张将如何影响其他人。此外,公民要提升个人数据保护意识,警惕个人信息的授权和分享。对此,国家提供相应的数字素养教育显得尤为重要。


例如,英国下议院在 2019 年报告中提出“数字素养应该成为国民教育的第四大支柱,与阅读、写作和数学同等重要”。提升公民在数字社会的知识素养和生存技能,是算法治理的重要途径。


最后,算法瞄准的多圈层治理需要不同圈层和各个主体之间的有机协作和相互制约,外部的法律规制和舆论监督,内部的平台治理和政党共识,以及个体数字素养培育对于算法治理都至关重要。


例如,在每次选举之后可以由公民团体、跨党派组织、平台公司、媒体代表等组成第三方评估机构,对选举过程进行独立的“算法审计”(algorithm auditing)。


然而,多圈层复合治理是理想型的算法治理模式,现实中由于制度环境差异、利益考量不同,各方很难达成共识和一致行动。更严峻的是,政治极化与算法瞄准彼此强化,裹挟着政党/候选人、算法第三方、媒体和选民走向更加极化的境地,导致算法治理和选举改革陷入僵局。


未来何处去


当代西方选举已经进入技术密集型的新时期,数据驱动的算法瞄准被广泛运用于选举动员和政治说服,掌控海量的选民数据以及运用最前沿的算法科技动员选民成为决定胜负的关键。


算法主导的智能选举不仅出现在多数决制的美国和英国,还流行于比例代表制的发达民主国家,甚至开始蔓延至新兴民主国家,其兴起不仅改变了传统的选举动员模式和选民决策方式,而且产生了一系列深远的政治影响。


算法瞄准包括三个核心技术过程:选民数据的采集和预处理;选民分类、模式识别和算法预测;选民瞄准和个性化动员。


算法瞄准在发展初期曾标志着竞选方式的突破创新,有效拓展了选举动员渠道,有助于提升投票率和选举民主的活力。


然而,随着选举中“算法军备竞赛”愈演愈烈,最前沿的算法科技和商业模式被运用到选举场域,选举民主产生了多重异化,包括信息操弄和选民操控、消极竞选和政治极化、政治代表性偏差和“回应-问责”失灵。算法瞄准正在重塑西方的选举政治生态,影响了西式民主的程序正义和结果正义。


算法瞄准本身只是选举工具,虽然算法瞄准可能尚未达到媒体所渲染的危机局面,但随着政党/候选人在选举利益最大化的驱使下无所不用其极地运用算法瞄准来操控选民,西方选举的游戏规则和竞争格局将彻底改变:


选举的中心不再是选民而是数据,竞争的核心不再是政策而是算法。选举民主的前提、过程和目标都将出现异化,最终随着算法瞄准的不断升级和无限制使用,通过投票聚合选民偏好从而选出政府回应选民需求并接受选民问责的民主链条将出现更多裂痕,甚至危及民主政治的健康运转。


如何扭转这一趋势,让算法科技服务于民主政治?


西方各国已经意识到算法治理的重要性,致力于构建多圈层的复合治理结构。然而,就如何把握言论自由与个人隐私之间的边界、算法经济与权利保护之间的张力、竞选效率与政治伦理之间的平衡等问题,各方分歧严重。


算法治理的过程也是不同政治力量博弈的过程,未来如何发展,值得跟踪观察。就学术研究而言,算法瞄准的兴起为我们提出了一系列崭新的跨学科研究议题,包括技术与政治的关系、算法的武器化、算法审计、算法治理模式、算法对政治极化的影响,等等。


加强相关研究,不仅可以帮助我们把握西方政治发展的最新动态,研判西方政治制度的发展趋势,同时能够提升我们对新技术环境下人类政治行为的一般性认识。

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
正在改变与想要改变世界的人,都在 虎嗅APP