作者通过对比人类直觉、AI情报分析和市场群体智慧在下届美联储主席预测中的表现,探索叙事分析在金融决策中的价值,并设计实验验证AI与人类协作的潜力。 ## 1. 实验设计与参赛选手 - **比赛目标**:预测2025年美联储主席提名结果(鲍威尔继任者),验证人类、AI和市场群体智慧的准确性。 - **参赛方**:人类(作者+AI助手"小跑叙事雷达")、专业AI模型Atypica(麦肯锡分析师风格)、通用模型Gemini、预测市场Polymarket(当前赔率:哈塞特59%/沃什19%/沃勒12%)。 - **关键变量**:政治黑箱、特朗普频繁表态(如近期称"两个凯文都很棒"导致哈塞特胜率跳水)、市场敏感性。 ## 2. 叙事分析框架 - **四维模型**:提出"叙事+情绪+注意力+时间=预测"公式,强调需追踪叙事生命周期(诞生、扩散、反转、消退)。 - **AI优势**:24小时监控信息流,区分谣言与事实;人类优势:政治嗅觉和"弦外之音"解读(如特朗普发言的潜台词)。 - **局限突破**:传统数据挖掘仅获相关性,大模型能捕捉语言中的因果链,辅助构建故事逻辑。 ## 3. 应用场景与深层价值 - **金融决策**:预判市场波动(股市/债市/加密市场)、调整仓位和对冲策略。 - **扩展潜力**:适用于政策分析、经济现象解读,甚至早期叙事干预(如公关或国家机器用途)。 - **核心结论**:人机协作最优——人类定方向/提问题,AI执行监控/验证,结合"群体智慧"的金钱信号(如预测市场赔率)。
两个Kevin跑得快:人类直觉vs. AI情报分析vs. 市场群体智慧大比拼
2025-12-23 08:02

两个Kevin跑得快:人类直觉vs. AI情报分析vs. 市场群体智慧大比拼

本文来自微信公众号: 肖小跑 ,作者:肖小跑,原文标题:《两个Kevin跑得快:人类直觉 vs. AI情报分析 vs. 市场群体智慧大比拼》


两个Kevin,两个Kevin,


都有戏,都有戏。


一个更爱川普,一个更爱华街,


真纠结,真纠结。


01


我的《发现叙事》substack和播客已经运营一段时间了。初衷是想搭建一块实验场,看看在“发现叙事—分析叙事—预测叙事对现实世界的影响”这件事上,我有没有和AI的契合点?AI究竟在”发现叙事“中能发挥什么作用?更重要的是——AI和人类(我)谁更靠谱?


要回答这个问题,最简单直接的办法就是:比划比划。干脆和AI比场赛。


既然是比赛,那就要找一个比赛项目。这个项目需要有一个明确的结果、有足够大的不确定性、过程充满变数、叙事能多次反转、以及冒出黑马的可能性;最好关键人物三不五时发个爆款推文、说几句奇怪的话,让事情起波澜,让市场抖一抖。


机会来了。


下任美联储主席的提名,基本满足所有条件:


有一个明确的结果:鲍威尔任期2026年5月结束,到了一月,美国无论如何也会有一位新联储主席提名出现。


有足够大的不确定性:当前主要候选人包括凯文·哈塞特(Kevin Hassett)、凯文·沃什(Kevin Warsh)、克里斯托弗·沃勒(Christopher Waller)。有概率相当的两个Kevin,还可能有一匹黑马。


剧情也已经开始反转了:本来哈塞特呼声挺高,结果懂王前几天接受采访时突然改口,说沃什也是头号人选,还来了句“两个凯文都很棒”。这一嗓子喊出来,哈塞特在预测市场上的胜率直接跳水。


关键人物频繁发声:日子越近,懂王就愈加频繁地谈及心目中继任者人选。以懂王的性格,谁也不能保证圣诞或者跨年时一高兴,直接给大家爆一个大礼包。


能影响市场:这绝对是2025最大政治赌局–影响股市、债市、通胀、黄金、加密市场、还有大大小小的赌盘们。


说到赌盘,虽然现在全世界都在关注,但能给人最直接观感的还是Polymarket。截至我打这行字时,polymarket上的赔率如下:


(Kevin Hassett领先59%,Warsh 19%,Waller 12%)


虽然历史无数次证明,拿真金白银投票的市场“群体智慧”往往是最准的,但在这种充满了政治黑箱和复杂考量的人事任命面前,单纯靠赔率有时候也未必灵,人类对“厚黑学“的理解也许还能派上点用场。


距离明年1月(或年底)还有不到20天,日子越近,就像期权快到行权日一样,任何一点风吹草动都会引发巨大波澜。


所以,我决定发起这场实验,看看谁能押中胜者,以及预判对市场的影响。


02


下面介绍一下参赛选手:


  • 人类选手:我(The Human Narrator)

但我不是自己肉搏。我和小伙伴开发了一个AI发现叙事助手:帮我全天候监控相关叙事的整个生命周期,发现有价值的情报。


我,则保留人类最核心的优势——直觉、政治、八卦的嗅觉以及对“弦外之音”的理解。我会用自己的经验和判断下结论。

我的装备:(先姑且称为小跑叙事雷达)



这是小伙伴帮我开发的,一个能帮我24小时扫描信息变化、抓住(并区分)rumors和facts、探测关键叙事生命周期(哪个叙事在长大,哪个在转向,哪个在消退)——的AI agent。


而我人类,则用自己的经验、分析能力、和直觉,来找到这背后可能会带来的行为偏好的变化。用我自己对政治和人性复杂关联的理解,来做判断。


  • Atypica:(The AI Consultant)

我能找到的、最有趣的、能替代人类咨询师分析师的垂类模型。它的人设是麦肯锡情报分析师:能大范围扫描、做二手调研、一手调研、和专家访谈;强证据链整合、严格推演。


  • Gemini(The Benchmark):代表主流、非垂类模型的推理。看看是“啥都懂模型”更厉害,还是“专业模型”更靠谱?


  • Polymarket:代表金钱的直觉和群众的智慧。


比赛规则:比较简单粗暴——从12/24日除夕夜启动,到名字揭晓那一天截止。大概每三天更新一次,把各参赛选手发现叙事、分析过程、和预测结果做对比。


03


我为什么想做这件事?


因为信息过载时代,传统指标不是频率太低,就是反应太慢,难以捕捉驱动市场的真正推手。现在的金融舆情分析,多数还停在“解释当下”上,而投资更需要“预测之后”。


新闻里并不全是事实,只有把时间拉长,看清叙事的产生、扩散、分化和消退,才更接近真相。


经常看我写文章的伙伴们都知道,这件事我已经惦记了很多年了,文章写过好几篇,书也写了两本。


不怕贼偷,就怕贼惦记。经过这么多年的惦记,我甚至自己设计出了一个”叙事情绪周期“和一套判断公式(我在《一点探索:如何制造一台故事机器》中写到过):


  • 一个叙事(或者关键词/热词)刚刚诞生时,一般不会引起太多注意力,受众或市场会尝试不同观点,需要一个过程给新叙事贴上标签并定性。标签并定性之后,受众的注意力才会有明显变化。


  • “注意力”就像是叙事的生命值。市场上的故事、故事的情绪、情绪的扩散,只有跟“注意力”组合起来,才有了动能。


  • 还需要加上一个时间维度,它成为爆款的时间是长还是短?是短时间内迅速吸引注意力,还是在相当长一段时间持续存在?是“突然反转”还是“积极鼓吹”了很长时间?


以上过程可以总结为:叙事+情绪+注意力+时间变量=后续发展预测。四个维度缺一不可。


以前我尝试过数据挖掘和情感分析,发现局限很大:前者多是相关性,后者只是给情绪打分,顶多算粗筛。


而人类做决策,这不是靠因果,也不是情绪上头,而是会跟着一个“故事”走。


直到大模型的推理能力reasoning成为主流,我们发现“语言里的因果”更容易被抓出来——人类借助它,会更容易把零碎线索串成靠谱的故事链。


而且进入AI时代后,叙事节奏变快,拐点密集,人力单打独斗容易漏。AI agent可以24小时帮你看信息流,追踪叙事生命周期:哪个主题在抬头,哪个在转向,哪个在消退。


换句话说:“发现叙事”需要一个有目的的“侦探”心态:人来定方向、提问题、判断含义,模型来铺网、守夜、反复校验。我们的目标不是看热闹,而是判断一个故事能不能成为趋势,它是在变强还是在掉头,哪里可能断档——然后把判断转成行动:比如应用在投资,就是仓位怎么配,风险怎么对冲,哪些资产更敏感,哪些板块可能受益或受压。


它的应用场景不只是投资,或者赌下届联储主席,还可以用在对很多市场走势、经济现象、甚至政策执行的分析和判断上。


当然,理论上也可以用它来介入某个叙事早期的扩散路径,或让它加速长大,或将其扼杀在摇篮里。但这个目的就不是我的目的了,它可能是大公关,大平台,大国家机器的应用场景。


接下来,我会尝试按计划更新:给出三方概率、关键证据、叙事变化的理由,以及对市场的直接影响假设。


至于最后谁胜出,就交给时间吧。友谊第一,比赛第二!

AI创投日报频道: 前沿科技
本内容来源于网络 原文链接,观点仅代表作者本人,不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com,我们将及时核实并处理。
正在改变与想要改变世界的人,都在 虎嗅APP