本文来自微信公众号: 斯坦福社会创新评论 ,作者:SSIR中文版
在有色人种社区联盟(Coalition of Communities of Color,CCC)与俄勒冈州卫生局(Oregon Health Authority,OHA)启动为期多年的合作时,双方携手对一项关键公共卫生信息来源——俄勒冈州学生健康调查进行了现代化升级。这项每年在俄勒冈州开展的调查,旨在追踪健康趋势,为影响数千名青少年及家庭的政策决策提供依据。
但问题在于,年复一年,这项调查虽揭示了诸多不平等现象(例如有色人种学生遭受欺凌或面临心理健康问题的比例更高),却未能阐明这些不平等产生的根源、具体表现形式,也未能反映社区期望采取的应对措施。数据揭示了差距,却未提供弥合差距的途径。
数据影响着我们生活的方方面面。
CCC携手联盟内其他文化特色组织及本地区有色人种研究者,致力为俄勒冈州学生健康调查探索出更优质的数据呈现方式。他们与深谙学生心理的高中教师合作,并直接走访学生群体,深入了解哪些问题对他们至关重要。通过“你近来如何?”“你需要哪些支持?”等简单直接的问题,揭示了该州标准化调查完全忽略的痛点。这一过程产生的丰富情境化数据,不仅揭示了系统的缺陷,更具体呈现了缺陷成因及学生对需求满足的诉求。实践证明,与亲历问题的人士合作能设计出更优质的调研问题,进而获得更精准的相关数据。
更优质数据所带来的改进成效显著。OHA成立青年数据委员会,让年轻人直接参与新版学生健康调查的设计;CCC将改进与升级的过程编纂成详尽的社区简报。《俄勒冈州学生健康调查》首次纳入三个开放式问题,收获逾4000条定性反馈;卫生局更发布开创性分析报告,解读学生获得发声机会后的真实诉求。
CCC与OHA的实践给了我们启发:将社区视角产生的数据与机构数据相结合,既可行又必要。当获得多元化证据后,决策者就能制定出更贴合情境、经验和社区认知的高质量政策。
然而,尽管取得了这些成果,相关工作仍持续遭遇阻力。因为它挑战了“黄金标准”的主流量化模式。例如,OHA等主流机构至今仍过度专注于维护纵向定量数据集,追踪多年间学生健康指标的变化趋势。任何问题类型或方法的调整都会被否决,理由是这会破坏趋势线。维持数据连续性以支撑长期论证的诉求,已然凌驾于改善数据所追踪的现实之上。

在美国,主流机构通常依赖我们所称的主流数据(dominant data),即由政府、营利性公司和大学等强势机构生成的信息。这类数据依据这些机构的规则收集,旨在为大规模人群决策及重要资源分配提供支持。它通常以统计形式呈现,也就是被机构视为客观权威的量化汇总信息。主流数据主要包含两种类型:
1.行政管理数据:指个人在与系统交互以获取项目或服务时产生的信息。学生入学时需提供人口统计信息,考试成绩会被记录,出勤情况将被追踪;人们申请公共福利、与刑事司法系统交互或使用公共交通时,数据也会随之生成。这些记录累积成庞大的数据集,机构借此从量化角度理解人群特征并追踪结果。
2.群体层面的调查数据:通过大规模问卷收集,旨在监测广泛人群的趋势变化。美国人口普查、美国社区调查及各州健康调查等工具,通过研究者和专家设计的标准化多选题,以全局视角描绘社会现状。
这两类数据都发挥着重要作用。它们既能揭示群体层面的不平等现象,又能帮助机构追踪特定变化的演进过程。
我们面临的问题并非这些数据的存在形式,而在于它们在机构系统中占据了至高地位,被奉为决策过程中首要乃至唯一可信赖的依据。换言之,主流数据被默认为客观、科学,是理解现实的最权威途径,而其他对现实的认知却被轻描淡写地归为个人经验或证据不足。当决策者将统计数据作为“验证”边缘化群体经历的前置条件,否则便不予采信时,这种行为尤为险恶。统计学获得权威地位的历史,与种族主义和优生学有着千丝万缕的联系,这种令人不安的遗产至今仍在塑造我们对数据的认知与价值判断。这些方法论本身往往承载着学者所称的“白人逻辑”——将种族主义假设植入数据生成与解读的框架中。对统计学的过度依赖造成了多重关键局限:
以白人群体经验为默认基准|大多数主流数据采集工具与研究方法,对白人群体的适配性与可靠性最优。抽样策略、问题设计和分析框架往往无法准确或细致地捕捉有色人种群体的真实经历。更有甚者,边缘化群体数据的收集常因“小样本问题”遭到压制或完全剔除——机构声称数据集中某些特定群体的样本数量不足以支撑可靠结论,导致整个群体从官方记录中被抹除。
助长缺陷思维|当数据通过群体间不平等的视角呈现,即展示有色人种群体在各项指标上逊于白人群体时,便强化了“特定群体是待解决的问题,而非不公正制度受害者”的叙事。我们统计受欺凌青少年的数量,却未深究种族主义、跨性别恐惧症等系统性压迫的根源;我们进行测量,却未提供实质性转型路径。过度依赖统计显著性作为真理仲裁者,并将狭隘量化标准凌驾于人类现实之上,这种做法已被批评为会导致就业机会、司法公正乃至生命的损失。
缺乏对背景信息的了解|主流数据擅长基于追踪指标(如健康结果、教育成就、住房稳定性等方面的不平等)识别现状,却鲜少揭示不平等的成因及解决之道。若不理解塑造人们生活的历史、结构和文化背景,机构就无法制定出有针对性的解决方案。
运作模式基于机构逻辑而非社区逻辑|所提出的问题、使用的分类标准、强加的时间框架,皆由数据收集机构决定,而非被记录的社区。这意味着最终数据主要用于回答机构关心的问题,而非社区关切的问题。
边缘化和抹杀效应|那些无法被制度化分类体系精准归类,被视为规模过小而遭忽视,或是其经历无法通过标准化工具捕捉的群体,要么从数据集中消失,要么被归入某个种族类别——这种归类往往掩盖了该制度类别中不同群体所经历的不平等现象的多样性。他们的现实状况无法影响政策制定,因为驱动决策的数据系统根本看不到他们。
我们常听闻对“数据指导”或“数据驱动”决策的追求。但现实是,主流机构的决策者并非主要依据数据和统计信息作出决策。他们基于政治考量、权力关系和优先事项作出决定,再用数据为决策背书。若唯一可信的数据源自主流渠道且强化主流视角,这种循环便永无止境。

是否存在其他解法?倘若社区通过日常经历、人际关系和组织活动所积累的知识,能够被提升为决策的可靠依据呢?
这就是社区数据:由社区自主生成、反映其日常生活形态的证据,体现着以社区为中心的认知方式、存在状态、行动模式与梦想图景。社区数据能够以多种形态呈现,包括数字、文字、艺术、音乐、声音、地图,涵盖社区分享、表达和阐释自身生活体验与愿望的多重多元方式。
关键在于,社区数据需要系统性地收集、解读和运用根据社区规则产生的信息。它提供关于人类过去、现在及理想未来的经验背景信息。
社区数据以行动为导向、以价值为内核。它不追求中立性——因为数据本就不可能中立,而是旨在揭示不公平的现实,识别需要改变的领域以惠及更广泛的人群,体现路缘坡效应(the Curb-Cut Effect):为非优势群体设计的解决方案,最终将造福所有人。
与通常通过非个人化或交易活动收集的主流数据不同,社区数据源于人际关系。它通过个案工作者与家庭的对话、社区成员主导的焦点小组、参与式研究过程、社区组织工作,以及那些与服务对象保持深厚联系的特定文化组织的日常工作生成。
社区数据提供了主流数据无法企及的价值:揭示不平等现象背后的成因,展现制度如何辜负了特定群体,并汇聚亲历者的解决方案。当住房社工走访居住在庇护所的家庭,当社区卫生工作者记录医疗服务获取障碍,当青年组织者绘制社区生活图景,这些都是社区数据的生动体现。它不仅揭示问题,更指明了基于社区自身需求与愿景的前行之路。
社区数据绝非只是为了补充量化研究的定性数据或故事。虽然社区数据通常具有定性特征(但并非总是如此),其本质区别在于数据基础而非形式。社区数据建立在五大核心原则之上:
1.基于关系|信任至关重要。社区数据需通过持续而深厚的联结获取,而非通过一次性互动提取。
2.尊重社区划定的边界|社区自主决定应收集与不应收集的信息、数据存储与共享方式,以及保护民众免受伤害的规程。
3.激活多元数据主体|从项目协调员到社区联络者,再到直接服务提供者,每个人都通过人际关系和日常工作掌握着社区数据。
4.挑战主流数据系统|通过将社区视角引入机构决策,社区数据推动系统高效响应、清晰权责边界且持续更新。
5.确保社区成员获得切实利益|社区数据必须带来实质性改善,例如更优质的服务、更充足的资金投入、反映社区意愿的政策调整。
当我们说社区数据是破解过度依赖主流数据的一剂良方时,指的是它能弥补主流数据在促进社会正义工作中的特定局限性:填补缺失的背景信息,聚焦边缘化群体的声音,遵循社区的运作逻辑,着重展现优势与诉求而非缺陷,并让主流系统所掩盖的真相得以显现。
当主流数据与社区数据受到同等重视并被同时运用时,我们才能构建出更完整、更真实的社区需求图景。但当前,主流数据所获得的基础设施、资源和合法性支持,远超社区数据,这种失衡必须改变。
鉴于社区数据的发展需要专门的基础设施和持续投入,CCC正致力于构建一个社区主导的数字平台,旨在为环境正义事业收集、整理和共享社区数据。
这一愿景源于一个简单而深刻的认识:社区组织本身已掌握海量社区数据,但这些数据通常以零散无序的形式存在(如会议记录、口述陈述、观察笔记、登记表等)。它们虽价值非凡,却因缺乏系统化的整理、解读与具有战略性的运用机制,其潜力始终未能充分释放。
数据生态系统的构建正是为了应对这一挑战。自2023年起,在罗伯特·伍德·约翰逊基金会和德博蒙特基金会的支持下,CCC已联合20余家社区合作伙伴,共同构想我们称之为“波特兰最新数字社区花园”的愿景。
该系统将支持多个致力于环境正义问题的社区组织把数据输入共享平台,围绕特定主题进行整合分析,并以适用于不同受众(从政府决策者、资助方到社区成员本身)的格式呈现。
重要的是,在设计该系统时聚焦两大核心功能:
支持社区力量建设。数据生态系统构建了可信赖的知识生成机制,助力社区追踪自身知识储备、实证依据及对更包容未来的愿景。组织可借此洞察工作中的规律,与面临相似挑战的团体建立联系,并通过共识凝聚集体力量。
影响上游决策。当政策制定者和资助方考虑如何分配环境健康资源时,应当能够获取系统化的社区数据——这些数据揭示社区的实际经历、尝试过的方案、有效措施及迫切需求。决策者将不再仅依赖主流数据源,而是拥有扎实的社区证据为决策提供科学依据。
构建该系统的过程本身也带来了重要启示:
●我们认识到,数据所有权问题必须从一开始就明确界定并加以解决。目前,当社区组织与政府机构签订合同收集社区数据时,这些数据在法律上往往归政府所有,即使整个过程由社区主导也是如此。CCC正与政府合作伙伴积极协作,建立相关机制,保障社区组织对其收集数据的所有权。
●我们认识到,构建社区数据基础设施所需的专业能力与主流数据系统截然不同。我们需要理解社区需求的前端开发人员,借鉴毛利社区等原住民数据主权框架建立的数据治理模式,以及尊重社区时间规划和工作流程的技术支持,而非以机构的紧迫性为由打乱社区节奏。
●最关键的是,我们认识到,这项工作需要持续且充足的投入。社区组织已因应对社区中接踵而至的各类危机而捉襟见肘,若缺乏专项资金支持能力建设,提供技术支持,对数据系统进行持续维护,他们根本无力承担社区数据系统化的额外工作量。
这个数据生态系统展现了当我们致力于构建社区数据基础设施时的一种可行模式。我们希望它能成为一种可复制、可因地制宜的实践方法——无需原样复制整个数据系统,但可以作为机构支持社区组织收集、整理并运用自身数据推动变化,提供有益的启示。

社区数据无处不在。它存在于养老中心工作人员与长者的对话中,存在于教师对学生需求的观察中,存在于社区活动收集的反馈中,存在于社区联络团队掌握的知识里。无论您身处政府、慈善机构、学术界还是社区组织,都可以采取以下行动:
●审视主流数据的局限性。剖析所谓可信证据的预设标准。每当发现主流数据被单方面用于推动讨论或决策时,请追问:哪些偏见塑造了这些数据?哪些视角被遗漏?为解决这些数据凸显的不平等现象,我们还需了解哪些信息?
●识别并提升社区数据的价值。着手梳理组织或合作伙伴已收集的社区数据(包括非正式渠道),制定规范化收集与应用的计划。
●于决策环节突出社区数据的作用。在报告和演示中同时呈现社区数据与主流数据。使用或引用时明确标注为“社区数据”,并阐明其重要性。资金分配、政策选择和战略方向必须基于社区数据,而非仅依赖主流数据。
●投资社区数据的创建与应用。争取资金支持,使社区组织能够建立数据收集能力,保留数据所有权,并在数据解读与应用方面拥有决策权。
我们必须重塑“可信证据”的定义。我们需要这样的未来:影响社区的大多数决策既基于主流数据也基于社区数据,两者互补,各自因其独特价值而受到重视,且社区数据获得充分的资源保障与严格保护。
前路虽然崎岖,但势在必行。首要之务是认识到:那些深受不公正系统压迫的群体,恰恰掌握着系统转型所需的知识。我们必须珍视社区数据、为其提供资源支持并予以倚重。
米拉·莫辛尼博士是经过专业训练的文化人类学家,现任有色人种社区联盟平等研究所高级研究员。她负责领导该联盟的研究与数据项目,并与社区组织及主流合作伙伴协作,共同推动俄勒冈州的数据正义事业。
安德烈斯·洛佩兹博士是经过专业训练的社会学家,现任有色人种社区联盟平等研究所的研究总监,主导该研究所的战略规划与项目愿景,并致力于从地方到国家层面推动数据正义事业。
