本文来自微信公众号: 未尽研究 ,作者:Sam Kriss
人工智能生成的作品,曾经是科幻作品中的遥远回响,但在如今这个数字时代,它却已经无处不在:从小说、新闻到社交媒体评论,AI生成的文字越来越普遍。
社交媒体平台Instagram已在其评论系统中集成了人工智能:在你想要在别人的自拍下面留下评论时,你无需自己去原创,而是可以让Meta AI用它的语言替你表达。你可以选择“搞笑”、“支持”、“随意”、“荒诞”或“表情符号”模式。在“荒诞”模式下,你不会说“看起来不错”,而是说“你太锋利了,我被你的气场割伤了”。此外,几乎所有主流电子邮件客户端现在都提供类似的服务,邮件中杂乱无章的信息可以瞬间被“翻译”成流畅的人工智能语言。
这是一场汹涌的浪潮。然而,它却令人不安。如果把人工智能生成的文字比喻成歌曲,那么听起来似乎每一句话都在唱歌,但却唱得有点走调。
虽然人工智能能够交付你想要的任何东西,但实际内容本身其实并不出色,但不得不说,它确实很有辨识度。从随机文本补全器,到如今存在于每个人手机中的各种智能助手,人工智能发展出了自己独特的说话方式。比方说,人工智能写作总是使用破折号,并且总是说“这不是X,而是Y”。
这与人工智能的训练方式有关。在人工智能的训练数据中,破折号更可能出现在被标记为“结构良好、高质量散文”的文本中。人工智能是靠统计学运作的。如果这种标点符号在高质量写作中出现得更频繁,那么一种写出高质量写作的方法就是——绝对地、彻底地、浸淫在这种标点符号中。
这种现象用技术术语来说叫“过拟合”,而人工智能经常这么干。
人工智能还对“三句式”结构极度着迷。人类作家早就知道,把话说成三段听起来更有力也更有节奏感,但人工智能却以一种真正的狂热抓住了这一点。
以一个在Facebook和LinkedIn上病毒式传播的感人故事为例,故事开头如下:
她24岁。刚大学毕业。
他3个月大。被放在一个盒子里,留在医院外,附上一张纸条:
“对不起。请爱他。”
没人来接他。
没有家人。没有电话。只有沉默。
新闻上叫他“以利亚宝宝”。但大家都以为他最终会进入寄养系统。
除了她。
瑞秋没打算当妈妈。她只是在医院托儿所做志愿者。但当她第一次抱起他,他的小手抓住她的手指不放。她的心也抓住了她。
社工说她太年轻。太单身。太没经验。
她告诉他们:
“我可能没有丈夫。我可能没有钱。但我有爱。”
短短200多个字里出现了三组三句式。让人工智能不再说“这不是X,而是Y”,几乎是不可能的事。如果你让它写故事,它会更变本加厉地使用“没有X。没有Y。只有Z。”这种看起来更文学性的三板斧句式。
机器写作还有一个严重的缺陷:它们永远无法真正体验世界。正是因为这一点,许多最好的写作技巧对人工智能来说是遥不可及的。
在《到灯塔去》的开头,弗吉尼亚·伍尔夫描述她的一个角色俯瞰苏格兰海岸:“她面前是一大盘蔚蓝的水域。”我喜欢这个比喻。人工智能永远写不出这样的句子。没有哪个人工智能曾站在一个巨大的、被风吹拂的景色前享受它,或者坐下来饥肠辘辘地盯着一堆食物看。它们永远无法理解这两种体验之间那种微小而奇特的相同之处。
人工智能对世界的所有理解,都来自大量词语中的统计相关性。因为没有现实世界的锚点,它的所有感官语言最终都会附着在非物质的东西上。人工智能只能把“悲伤”比作“金属味”,把“星期四”写成“尝起来像几乎星期五”。由于缺乏真实体验,人工智能把所有感官都指向抽象:情绪永远“披”在句子上,咖啡店里“松节油与梦想同味”,卵石“携带曾是巨石的幽灵”。它们只能把概念一层层堆叠,直到轰然倒塌。
人工智能在过去几年里一直在观察和模仿人类,抓取整个星球的数据来咀嚼、消化和吐出,可实际上,人类也是AI的模仿者。
马克斯·普朗克人类发展研究所最近的一项研究,分析了超过36万个YouTube视频,这些视频由真实学者发表的即兴演讲组成。研究发现,人工智能语言正越来越多地从人类口中说出。我们越多地接触人工智能,就越无意识地学会它的语言,然后进行传播。人类开始“像AI”一样说话,AI再爬取人类新文本——这似乎完成了某种闭环。
破折号,你以前只会在文学作品中看到它,而不是政治家在网上发布的公开声明中。现在情况不再如此。
当美国总统特朗普下令向洛杉矶部署国民警卫队时,卡马拉·哈里斯在公开声明中回击道:“本届政府的行动与公共安全无关——它们是为了煽动恐惧。”也许下个月,乔·拜登也对他曾经的对手发表强硬言论:“共和党的预算法案不仅鲁莽——而且残忍。”奇怪吧,两位说话风格迥异的政治家,竟然用完全相同的写作风格。更不寻常的是,拜登和哈里斯竟然与一位在网上发表声明的警察局长使用了完全相同的修辞方式:“发生在辛辛那提第四街的事件不仅仅是‘一场打斗’。它是秩序、体面和责任的崩溃——被视频拍下,并被人群欢呼。”
人类也学会了人工智能对名字的偏好。如果你让人工智能为你写一篇科幻故事,它有个奇怪的习惯,会把主角命名为“Elara Voss”。男性角色则通常叫“Kael”。如今,亚马逊上有数百本自费出版的书籍,主角无一例外都叫Elara Voss或Elena Voss;而在2023年之前,这样的书一本都没有。
人工智能还真的很喜欢“delve”(深入探讨)这个动词。这一点是可以用数学衡量的:研究人员查看了生物医学论文数据库PubMed上的摘要,发现自从我们把大量写作任务交给机器后,一些词的出现频率开始上升。“delve”是一个极端案例,尤其是其变体“delves”——2022年,该词在每万个PubMed摘要中大约出现一次;到2024年,该词的使用量激增了2700%。
但是,2024年当投资人保罗·格雷厄姆在网上发帖说,“我注意到它用了‘delve’这个词”,却立即引发了强烈反对。就像那些以喜欢破折号为身份标志的人一样,“delve”的支持者们也愤怒了——这个原本更常在尼日利亚使用的词汇,被人工智能偷偷带到了原本不属于它的地方。
九月底,星巴克开始关闭其在北美的一系列门店。这些门店的窗户上都贴着同一张纸条:“我们知道这可能很难接受——因为这不只是任何一家店。它是你的咖啡馆,是你日常节奏的一部分,是回忆被创造的地方,是我们与伙伴之间多年来建立有意义联系的地方。”
我想我知道那张纸条是谁写的,你也是。每一天,另一家大公司、政府官员或你的远房亲戚都在选择用这种声音对你说话。这就是世界现在的声音。这就是一切选择说话的方式。混合隐喻和空洞的真诚。非个人化却过于矫饰。我们正在挖掘孤独的回声。我们正在展开遗憾的笔触。我们正在说出有意义的意义。
--
原文链接:
https://www.nytimes.com/2025/12/03/magazine/chatbot-writing-style.html
