本文来自微信公众号: 果壳 ,作者:游识猷
“向着月亮出发,即使失败,你也将置身群星之中。”诺曼·文森特·皮尔(Norman Vincent Peale)这句话曾经激励了无数人。它暗示着,要野心勃勃,要去做困难的事,立下宏大的志向,这样即使你未能达成终极目标,也至少会取得不错的成就。
唐太宗李世民也说过类似的话,“取法于上,仅得为中;取法于中,故为其下。”你要定下最高的目标,才能得到中等的结果,要是一开始就定下中等目标,那得到的恐怕就是下等结果了。总之,目标越高越好,野心越大越好。
但也有另一派观点,伏尔泰喜欢引用古老谚语“完美是优秀的敌人。”这句话后来有多个变种:“完成胜于完美”,“为了追求更好,我们常常毁了原本的好”,“‘非完美不可’这条箴言,大可以拼写成‘瘫痪’。”以及“现在就果断执行的好计划,胜过下周才执行的完美计划。”在中国,就是“贪多嚼不烂”,“两鸟在林,不如一鸟在手”。目标不要太高,野心不要太大,免得最后落得两手空空。
在人生抉择上,到底哪一个策略更优?,“要就要最好的”,还是“差不多得了”?
2026年5月,三位研究者伊卡特琳娜·兰德格伦(Ekaterina Landgren)、瑞安·兰根多夫(Ryan Langendorf)和马修·伯吉斯(Matthew Burgess),在《物理评论E》期刊上发表了一篇获得“编辑推荐”的论文,标题很直白,《商业、政治与生活中的最优野心》。
他们用数学证明给出了最终结论:最优野心不该无穷大,应该是有限的,且精确地落在高于中间水平的某个位置。
论文作者马修·伯吉斯说,“我们经常听到相互矛盾的建议:一方面,我们不想安于现状;另一方面,我们又不想追求遥不可及的目标,最终失望而归。我们研究的核心观点是,通常情况下,如果你努力做到比平均水平更好,而不是无限优秀,那么你的境况就会最好。”
不要去够月亮,不要去够群星,去够一颗你跳一跳就能摸得着的苹果。
我们都是迷雾果园中的搜寻者
要理解这篇论文的核心机制,请想象你被蒙上眼睛,推进了一座巨大的苹果园。
这座苹果园有几条规则。
▪️第一,你的时间是有限的,太阳落山前你必须离开,无论手中有没有苹果。
▪️第二,你每走一步都能摸到一个苹果,但你无法看到整座果园的全貌,只能看到当前这个苹果的品质。
▪️第三,你每一步都要做一个选择,是放弃目前手里这颗苹果,去搜寻下一颗,还是做出一个不可逆的决定:停下来,宣布“就这个苹果了”,然后在剩余的所有时间里反复品尝这颗苹果带来的收益。
“苹果”是你人生中遇到的任何一个选项:一所大学、一座城市、一份工作、一个创业点子、一个约会对象……
“太阳落山前的总步数”,代表你的项目期限、可用时间,乃至剩余生命。
而你内心判断“这颗苹果够好了,我不再找了”的标准,就是论文定义的满足阈值——也就是你的野心。

野心设得低,你很快就会停下来,但可能错过了前方更甜的果实。
野心设得高,你有机会摸到极品,但也可能在太阳落山时两手空空。
这就是搜寻与享受获益之间永恒的矛盾:如果你完全不搜寻,不可能获益。但人生有限,每多花一段时间去搜寻,你就少了一段可以用于获益的时间。
研究团队在超级计算机上运行了一万次这种模拟人生。一万个数字人,带着从“极度保守”到“极度野心”的不同满足阈值,在各种地形的果园中反复搜寻。每个数字人拥有1000个时间步的标准生命周期。
最终,研究者统计了不同野心水平下的平均累计收益,发现了如下结论。
“野心-回报”的∩形曲线
野心与预期收益之间,呈现∩形单峰曲线,先升后降,中间存在一个明确的最高点。
野心太低,阈值设在平均值附近,你会早早把自己锁死在一个平庸的回报上,错失大量唾手可得的更好选择。
野心太高,阈值趋向无穷,你会在搜寻中耗尽全部生命而一无所获。

最佳点大概在哪?当生命周期为100个时间步时,最优阈值约为平均值之上1.6个标准差的地方。
这里大概是“普通人能接触到的、非常优秀的常态区间”。它是一种明显超出平均的卓越,但依然属于大众可以理解、可以靠近的范畴,并不是那种让人难以企及的“极端变异”或“罕见天才”。
如果所有可能的回报按正态分布排列,平均值之上1.6个标准差意味着大约前5.5%的位置。以高考为例,那就是把目标定在211大学的水准。

论文还通过严格的数学证明确立了两条铁律:
第一,最优阈值是有限的。
只要你的生命不是无限长的,那个能让你累计收益最大化的野心水平就必然是一个可以计算的有限数字。
“追求完美”在数学上等价于一种特殊形式的自我毁灭,你用无穷的标准去丈量有限的生命,结果必然是在无尽搜寻中耗尽一切。
只有当你拥有永生,“向着月亮出发”才是理性策略。对我们这些终有一死的凡人来说,最优野心永远有一个天花板。
第二,最优阈值严格大于平均值。
只要你的生命包含超过一个决策回合,设定高于平均水平的目标就在数学上绝对优于“随遇而安”。
最优阈值随生命周期的增加而上升,其增长轨迹近似于对数函数。

莫欺少年穷,拥有的时间越多,就越应该野心勃勃——但这种增长是递减的,永远不会趋向无穷。
不对称惩罚,“野心过高”
比“保守过度”更糟
最佳野心目标我们已经知道了,大概是比平均值高出1.6个标准差的地方。
现在问题又来了,如果我们不知道“比平均值高出1.6个标准差”到底应该是个什么水准,该怎么办呢?我们是应该劝自己胆子再大一点多试几次,还是应该劝自己小富即安差不多就收手呢?
答案是很明确的,宁可保守过度缩手缩脚,也不要野心过高好高骛远。
从回报曲线形状来看,它的右侧下降的速度远快于左侧,也就是说,比起最佳点,野心小一点,稍微过度保守一点,带来的损失不大;但要是野心大一点,稍微过度好高骛远了一点,带来的损失就可能急剧增加了。

原因很简单:时间是有限的,不可逆的。时间一旦花在搜寻上,就永远无法用于获益。
当你因为阈值过高而迟迟无法进入“享受收益”的阶段时,你失去的不仅是那个完美选项本身,更是整个“享受复利”的时间窗口。
另外,当阈值从最优点向右偏移时,找到满意选项的概率呈指数级下降(因为你要求的越来越罕见),而搜寻阶段的累积损失却在线性甚至超线性地增长。
相比之下,当阈值从最优点向左偏移时,你只是“少赚了一些”——你确实提前锁定了一个不够好的选项,但至少你有足够时间享受它带来的收益,而不是两手空空地不断搜寻。
在一切序列决策中,“过于挑剔”的统计学代价都远超“略微将就”。当你对回报分布的形状不确定时(而现实中我们几乎永远不确定),偏保守是更安全的错误方向。
这并不是在为平庸辩护。最优阈值仍然严格高于平均值——你依然应该追求卓越。
但如果你必须在“目标定高10%”和“目标定低10%”之间选择一种犯错方式,选后者。
根据大环境来调节最优野心值
野心还应该受周围大环境调节。

环境平滑度(可预测程度)和偏度(奖励和损失分布),都应该影响你的“最优野心”。
环境越不可预测,野心应该越大
第一个重要的环境参数,叫“邻近相关性”,意思是你下一步摸到的苹果品质并非完全随机,而是与你当前位置有关。如果你现在站在一片果实累累的肥沃黑土地上,下一步大概率也不会踩进毫无果实的沙漠。
不过,有的果园“邻近相关性”更大,下一个苹果的品质更好预测。有的果园“邻近相关性”更小,好苹果和烂苹果毫无规律地交替出现,每走一步都像在抽奖。
论文把那种好预测的环境叫“平滑景观”,随机混乱的环境则叫“崎岖景观”。
论文的结论是,当环境越不可预测(越崎岖),最优野心应该越高。环境越可预测(越光滑),最优野心则应该越低。
原因在于,混乱是阶梯,乱世更可能一步登天,出现极端好运。

在可预测的、平滑的环境里,前后两次的结果高度相关,你这次得到的回报和下次得到的差不多。这就像爬一座缓坡,你只能一步步爬,每走一步只能上升一点点,不可能一步从山脚跳到山顶。
如果你现在处于一个低收益的位置,你只能通过一点点的小改进慢慢往上爬。假如你在这种环境里设定了一个特别高的目标,你可能在有限的时间内根本爬不到那个高度——因为每一步的进步都太小了,时间不够用。
而且既然你已经知道下一次的结果大概率跟现在差不多,继续搜寻也不太可能有什么惊喜。所以正确的做法是:降低目标,早点接受现有的还不错的结果,进入“收益”阶段,别再折腾了。
而在混乱、不可预测的环境里,每一次尝试的结果之间没有关联,上一次的结果完全不能帮你预测下一次会怎样,每次都是全新的随机事件。
这种情况会导致结果的波动特别大——有时候特别差,但也有时候特别好。用统计学的话说,就是“方差很高”,极端值(特别高或特别低的结果)出现的概率变大了。
既然每次都是独立的机会,那保持高目标、不断去“抽奖”,直到撞上大运,从长远来看你的总收益会比早早放弃搜寻要高得多。

打个比方,就像玩游戏时,平滑可预测环境是走楼梯,一层一层上;崎岖混乱环境是随机传送,运气好的话,下一秒可能直接把你传到顶楼。
左偏环境要“高野心+低风险策略”,右偏环境要“低野心+高风险策略”
先说明两个很容易混淆的概念——“野心”(Ambition)和“风险”(Risk)。
“野心”其实是一个“满意度阈值”的概念,你达到什么水平你就满意且停止搜寻了,没达到就继续搜寻更好的。
“风险”则是一种波动性和不确定性,比如出现极端负面结果的可能性有多大,出现极端正面结果的可能性有多大,环境的不可预测性有多大,等等。
“野心”是“目标的高低”。“风险”是“冒险的程度”。

接着解释“左偏环境”和“右偏环境”。

偏度指的是一组数据左右不对称的程度。
左偏环境,意味着分布的“尾巴”向左延伸,负极值(灾难)比正极值更剧烈。大多数时候结果还不错,但偶尔会出现特别惨烈的大灾难。平均值被灾难大幅拉低了,中位数通常高于平均值。
左偏环境的一个例子,就是一些所谓“趴在压路机前捡硬币”的投资策略——在99%的时间里,能获得稳定但微薄的收益,看起来非常安全;但在那1%的极端情况发生时,投资者会失去一切。
右偏环境,意味着“尾巴”向右延伸,即正极值(暴富)比负极值更极端。大多数人收益其实一般般,但有少数幸运儿简直是赢者通吃。平均值被极少数极高回报拉升,高于中位数。
右偏环境的一个例子,是风险投资,投100个项目,99个血本无归(不过损失最多就是投资额本身),但押中1个,就可能得到1000倍的回报。
论文作者认为,美国的经济增长,是一种左偏环境,大多数年份其实还不错,但是偶尔就会来几次严重的大衰退,明显拉低了整体的平均增长率。
而美国的创业和私人财富积累,则是一种右偏环境,极少数超级赢家把平均值拉得很高。

接着讲具体的数学策略。
在左偏环境里,要采用低风险策略,但野心要大一点,要激进地定一个超出平均值的目标。
低风险策略是因为,在左偏环境里,出事可能会是大事,极端灾难的结果太惨烈了,不能采用波动太高的高风险策略。
但野心和目标不要太低,因为偶尔几次的极端灾难会显著拉低平均值,如果你将目标设定在这个“被污染的平均值”附近,你其实就过度保守了。真实的“典型好年份”远高于这个均值。你的野心需要设在均值之上更远的地方。
反过来,在右偏环境里,你则应该采用高风险策略,但野心(目标)要脚踏实地,定得低一点。
要拥抱风险,敢于冒险,因为回报结构是“要么大赢要么小输”,下注的期望值为正。即使失败了,也不至于是灾难性结果。
但野心要定得低一点,因为那个被独角兽们拉到天上的“平均数”根本不代表你的现实可能性。大多数人的回报其实低于平均值,不是因为他们不够努力,而是因为平均值本身被极少数幸运儿扭曲了。
如果你把野心校准到那个虚高的平均线上,你将因为目标太离谱而错过大量稳健的成功机会。
最后,再强调一遍,“该冒多大险”和“该有多大野心”是两个独立的变量。一个人可以同时是一个谨慎的风险管理者和一个高野心的目标设定者;或者反过来,同时是一个敢于放手一搏的拥抱风险者和一个低野心的小富即安者。

禁止“向上比较”,
别总是跟朋友圈里最强的比
说了半天环境里的回报分布,回到一个现实问题:万一我们不知道环境到底什么样,回报到底怎么分布的,该怎么办?
现实里,我们不可能拥有上帝视角来俯瞰整个大环境。我们能做的就是观察周围的人,他们在做什么,他们的收益怎么样——这个“看别人来给自己定目标”的过程,就是社会比较,人类最古老的信息获取方式之一。
研究者发现,人们“看别人”的方式有两种,而且这两种方式带来的结果天差地别。

第一种方式叫全群体比较,简单说就是“看所有人的表现”。你不挑不拣,把身边所有人的野心和收益都看一遍,然后根据这个来调整自己的目标。
和“什么都知道”的上帝视角理想状态比起来,用这种方式定目标,你的最终表现会稍微差一点点。
因为你身边的人毕竟只是一小撮人,局部样本毕竟不如全局信息精确。你可能因为周围别人暂时表现好就变得不满足,放弃了本来不错的策略。
虽然这种方式不是最完美的,但它造成的损失也不太大。
相比之下,第二种方式“向上社会比较”,也就是“只看那些比自己收益更好的人,完全无视那些不如自己的人”,造成的损失就大了。研究直接把它描述为一种会“腐蚀”决策过程的毒药,后果是灾难性的,收益曲线直接腰斩,甚至出现断崖式下跌。
研究反复测试不同的条件(不同的群体大小、不同的初始目标范围),一次次证明了同一个结论:向上社会比较永远是最差的选择——它带来最低的平均回报,也对应着最低的最优目标值。

那些表现差的人的数据其实在告诉你“这个世界的真实水平大概就是这样”。你无视了这些信息,去追一个在数学上几乎不可能达到的虚幻目标,而之前第二条就说过,惩罚是不对称的,“野心过高”带来的损失,远大于“保守过度”带来的损失。
结果就是,你对自己“应该达到什么水平”产生了极度不切实际的期望。你变得永远无法满足,于是不断地辞职、创业、换赛道……在永无止境的低效搜寻中耗尽了本该用于“享受收益”的全部时间。
研究者之一的兰根多夫说,“被他人的成就所激励是好事,但如果只关注最成功的同伴的精选集,就会扭曲我们对‘什么是可实现的’的认知。在社交媒体上尤其如此,我们看到的大多是彼此精心策划的高光时刻。”
向上社交是用来学习方法论的,不是用来设定满意阈值的。观察比你成功的人如何做事,学习他们的路径、策略、思维方式,这些是有益的信息提取。
但如果你关注的是那些晒出的豪宅、旅游、融资……以此定义自己的“及格”,你很可能是在给自己设定一个过高的野心。
搜寻成本越高,野心应该越小
别忘了,搜寻是有成本的。
之前的几个模拟,其实只计算了时间成本,还没有把搜寻成本算进去。
而真实世界里,搜寻当然是有成本的。每多面试一家公司,你都要支付交通费、时间成本和心理损耗;每多相亲一次,你都在消耗情感能量和社交资源;每多尝试一个创业方向,你都在燃烧现金和信誉……
当引入搜寻成本以后,“最优野心”又该有怎样的变化呢?
研究者发现了一条简洁的规律:搜寻成本越大,最优野心就应该越小。
随着搜寻成本的增加,最优满足阈值(野心)和最大预期收益均呈现出同步下降的清晰趋势。

在最极端的情况下,继续搜寻的代价已经高到让任何形式的野心都变成净亏损。此时最优策略直接坍缩为“零野心”——抓到什么是什么,第一个选项就是最终选项。因为任何进一步的挑选在经济或时间上都是不划算的。
搜寻成本还显著加剧了“野心过高”的惩罚。在有成本的情况下,如果你设定了一个难以达到的高目标,你不仅会因为找不到目标而损失时间,还会因为每一个寻找的动作都在支付成本而迅速耗尽资源。这使得预期收益曲线在通过峰值后的下跌变得更加剧烈。
但是,这里有个重要的但是:虽然搜寻成本迫使你压低野心,但搜寻成本并没有改变“野心应高于均值”的定性结论。
不管搜寻成本多高,只要没高到让搜寻完全无意义,“追求比平均水平更好”就依然是数学上的最优解。
搜寻成本只是降低了野心的“绝对高度”,而没有改变它相对于平均水平的“领先地位”。
以上结论,在真实世界里成立吗?
研究者用两组真实数据对模型进行了实证检验。

第一组是美国四个城市异性恋用户在线约会的数据,研究者发现,不论是男性还是女性,都会发最多信息给“吸引力比自己好一点点的对象”。
并非“谁来都行”:用户不会把大量精力浪费在吸引力远低于平均水平的对象上,因为这属于“野心过低”,会导致错失原本可以达到的更好回报。
并非“只找名模”:用户同样不会只给那些吸引力远超自己的“超级名模”发信息。这种“过度野心”意味着在有限的时间内搜寻成功的概率极低,最终会导致在无果的搜寻中耗尽时间。
大家最努力求偶的对象,都是“比自己稍微优秀一点”的人。这种“中等野心”在“因太容易满足而错失更好对象”与“因追求完美而孤独终老”之间,取得了数学上的最佳平衡。
第二组是美国高中生申请大学的数据,
相比约会市场,申请大学的学生们采取的策略更为保守。
数据显示,大多数学生的申请努力(发送申请的数量),集中在那些SAT中位数与自己分数持平或略低的学校。

为什么中学生们没有采取“向略高于自己水平的学校发送最多申请”的策略?
原因可能有两个。
其一,很多中低收入的学生大量申请了保底学校,对于这些学生来说,地理位置的邻近性(为了省钱或照顾家庭)和学费负担,是比学术排名更优先的考量。
其二,“申请大学”的搜寻成本,比“在线约会”要高很多。
申请每所大学,都要针对性地修改自己的申请文书,交一笔真金白银的申请费。而在网上找约会对象,只要花点时间精力,发几条免费信息就行。
另外,如果申请名校失败,不仅白白浪费申请费,还可能要支付心理成本(被拒绝的打击)和社会成本(失去一年学年的时间风险)。
在高昂的搜寻成本和可怕的失败惩罚下,申请大学的学生采取了更为保守的策略,也就可以理解了。
基于数学模型的七条人生建议
再重复一遍论文给出的七条人生建议:
1、最大化收益的方式,是精准地找到一个高于平均水平(或你自身水平)的目标。
2、比起“过度保守”,“野心过高”更糟糕。
3、年纪越年轻,野心可以设得越高。
4、环境的波动性和不确定性越大,野心可以设得越高。
5、“左偏环境”要高野心+低风险策略。“右偏环境”要低野心+高风险策略。
6、向上社交是用来学习路径的,不是用来设定目标的。别只盯着比自己成功的人来定目标,要用全局信息。
7、搜寻成本越高,野心应该越低。
还记得那句“向着月亮出发,即使失败,你也将置身群星之中”吗?
论文作者伊卡特琳娜·兰德格伦说,“我的建议是,目标应该比月亮略低一些,向着星辰出发吧,但要确保你所去往的星辰是真实存在的。”

参考文献
[1]Landgren,E.,Langendorf,R.E.,&Burgess,M.G.(2026).Optimal ambition in business,politics,and life.Physical Review.E,113(5).doi.org/10.1103/dfw8-vhjk
[2]Don’t shoot for the moon:aiming for‘above average’is key to success,maths suggests|Science|The Guardian.https://www.theguardian.com/science/2026/may/29/dont-shoot-for-the-moon-aiming-for-above-average-is-key-to-success-maths-suggests
