12-21

ChatGPT 文风,原产地肯尼亚

新闻图片

一项最新研究揭示,ChatGPT的写作风格与肯尼亚教育体系培养出的正式英语写作风格高度相似,导致肯尼亚人撰写的文章常被AI检测工具误判为AI生成内容。这一现象源于殖民历史遗留的英语教育传统与AI训练数据的重合,引发了关于语言权力、文化认同和AI偏见的全球讨论。

5 来源
文风巧合:殖民遗产与AI训练的交汇

肯尼亚作家马库斯·奥兰格在《I’m Kenyan. I Don’t Write Like ChatGPT》一文中详细阐述了这一现象:他精心撰写的提案被客户要求"重写以增加人性化的触感,因为它听起来有点像ChatGPT写的"。[1]

这一讽刺现象的根源可追溯至英国殖民时期。肯尼亚教育体系,特别是KCPE(肯尼亚小学教育证书)考试中的英语作文部分,长期强调"女王英语"——一种正式、略带古旧词汇、严格语法结构的写作风格。这种语言曾是"权力的工具",是"文明的证明",也是社会阶层的分界线。[1]

而ChatGPT等大型语言模型恰恰训练于大量正式文本:过去两个世纪出版的书籍、学术论文、百科全书和法律文件。AI在追求权威性表达的过程中,无意间复制了"英国帝国的语言幽灵",与肯尼亚教育体系培养出的写作风格惊人相似。[1]

肯尼亚在ChatGPT生态中的双重角色

肯尼亚不仅是ChatGPT文风的"精神原产地",还在其实际开发中扮演了关键但被忽视的角色。根据维基百科资料,OpenAI曾雇佣肯尼亚外包工人(时薪仅1.32-2美元)来标记有害内容,这些工人被迫接触大量有毒和创伤性内容,一位工人将此工作描述为"酷刑"。[1]

这些标记数据被用于训练模型检测未来内容,构成了ChatGPT安全系统的基础。肯尼亚工人在低薪条件下为全球AI发展付出了巨大心理代价,而他们的劳动成果却很少得到公开认可。[1]

与此同时,肯尼亚也是ChatGPT采用率最高的国家之一。市场研究显示,“ChatGPT在肯尼亚、印度、阿联酋和巴西等全球南方国家特别受欢迎”,这与肯尼亚人对正式英语的熟练掌握形成了有趣呼应。[2]

AI检测工具的偏见与文化误判

学术研究已证实,当前AI检测工具存在显著偏见:它们"更可能将非英语母语者撰写的文章标记为AI生成"。[1]

对肯尼亚等前英殖民地国家的英语使用者而言,这造成了双重困境:他们花费一生时间掌握的正式英语,恰恰是AI模仿的对象;而当他们使用这种经过严格训练的语言时,却被机器判定为"非人类"。[1]

肯尼亚智库IEAKenya的报告指出,当地研究机构已开始利用ChatGPT等工具生成报告,如"全球经济与发展中心(CGD)利用ChatGPT生成关于新冠疫情经济影响的报告",但同时也面临着如何辨别AI生成内容真实性的挑战。[2]

这种误判不仅影响个人职业发展,还可能强化语言霸权——将特定英语变体视为"标准",而将其他变体边缘化。

未来展望:语言多样性与AI进化

专家预测,随着AI技术发展,ChatGPT等工具将逐渐采纳更多语言变体和俚语表达。马库斯·奥兰格指出:“AI将采用更俚语化、更随意的说话方式,或者说,更具’人性’的表达方式。”[1]

这一转变将使AI更好地适应全球语言多样性,包括肯尼亚等国融合了斯瓦希里语、基库尤语等本土语言元素的英语变体。[1]

肯尼亚教育工作者已经开始应对这一挑战。例如,内罗毕学校的学生"首先通过更传统的方式学习内罗毕的起源和发展",同时"阅读Kelsey Rice的’Chat GPT和…'节选",培养对AI生成内容的辨别能力。[2]

未来,随着AI技术与全球南方国家语言文化的深度融合,ChatGPT的"原产地"将不再局限于任何单一国家,而是成为全球语言多样性的集合体。

本内容由AI生成