他们想做让14亿中国人都用得起的“律师”
原创2026-04-21 16:42

他们想做让14亿中国人都用得起的“律师”

出品|虎嗅科技组

作者|陈伊凡

编辑|苗正卿

头图|AI生成


“AI原生100”是虎嗅科技组推出针对AI原生创新栏目,这是本系列的第「52」篇文章。


中国有约83万名执业律师,服务14亿人口,每1700人摊到一名律师,大约是美国的七分之一。大多数中国人一生中不会主动联系律师,找不到门,也付不起钱。


张惟师认为,这是一个商业机会。他是幂律智能的联合创始人兼CTO,这家法律AI公司背后站着线性资本、蓝驰创投、源码资本、红杉资本等头部机构。这也是中国第一个商业化的法律AI大模型公司。

今年,是幂律成立后的第8年。


说起幂律的成长,2023都是一个避不开的时间点。那一年上半年,大模型出来了。投资人想看新东西,客户也想看新东西,但幂律的老产品——企业合同审查系统还没来得及用大模型改造,新产品也没出来,账上上一轮融资的钱快花完了。


“青黄不接”,张惟师后来形容那段时间是“硬撑过来的。”


转机出现在当年6月:在决定向大模型转型后,幂律推出了垂直法律大模型PowerLaw GLM,做了一个对话产品的demo。两个月后,拿到了8000万融资,蓝驰领投——这笔钱,是中国法律科技赛道迄今最大的单笔融资


也是在这一年,一家叫Harvey的公司在大西洋另一端成立了。如今Harvey年收入1.9亿美元,估值92亿美元,获得了Sequoia、a16z、OpenAI累计接近10亿美元的投资,服务全球顶级律所,是法律AI赛道最炙手可热的名字。


投资人时常问幂律一个问题:“你们是中国的Harvey吗?”


每次都被张惟师否定了,幂律就是幂律,比Harvey早了整整六年。而且走的不是同一条路。


幂律智能团队照片 图片由幂律智能提供


Harvey服务的是大律所——美国律师付费意愿强,事务所愿意花钱买提效工具,订阅制跑得起来。

幂律想做的是另一件事:用科技让法律服务触达那些根本没有“法律意识”的普通人和中小企业。中国有几千万家中小企业,遇到合同纠纷、劳动争议、债权追讨,要么忍着,要么摸索,鲜少有人知道自己的权利,也付不起律师费。


两个方向,是不同土壤中长出的不同的结果。


在法律AI这个赛道,有几个问题是每家公司都绕不过去的:要不要训练垂类模型?如何防止幻觉?内部怎么评估AI质量?在这种强信任的赛道,如何权衡人类律师和AI律师之间的界限?

 

幂律拿到8000万之后干的第一件事,不是扩张,是重构。除了之前B端的合同审查系统,内部开始孵化“吾律”这个项目。


为了消除幻觉,他们和智谱合作,训练法律垂类模型PowerLaw GLM。


一家初创公司,一上来就训练垂类模型,是一项很重的投入。张惟师说,在2023年,通用大模型能力还没有上来的时候,做垂类模型是非常有必要的,跟智谱合作在GLM3上做法律增量训练,“在当时是难得的资源”。因为在那个时期,市面上涌现许多法律AI团队,律师背景、不懂工程——直接把自己的法律知识喂给大模型就出产品了。


但站在今天,随着大模型能力的提升,幂律不再需要做重成本的增量训练,转向两类轻量工作:针对特定工具调用能力的微调,以及私有化场景下的小规模法律数据训练。


这项AI产品的核心价值有多少来自模型本身,又有多少在基于对法律行业认知上搭建的Agentic workflow 或认知架构?张惟师说,过去是60%来自模型本身,40%来自Agentic的工作流,但现在来看,则反过来了。80%来自Agentic的工作流,20%来自模型本身。


这句话背后意味着,模型的贡献越来越小,而80%则是对法律场景和业务流程足够理解,是大量真实案件积累出来的工作流,是让AI结果可信赖、可兜底的服务体系。这些东西不是算力能买来的,也不是靠模型升级能直接替代的。


“吾律”不是工具。在张惟师的设想中,它可以完成承担一个AI律师的角色。支撑这种信任的,是一套持续运转的数据闭环:AI给出结果,用户复核修改,“原始结果”和“人工定稿”之间的差异,幂律会定期跑程序分析,再反过来优化模型。这是他们的内部评估体系,也是数据飞轮转起来的方式。


不过针对C端和中小客户的法律AI产品,有一个问题是区别于其他ToC的AI产品,那就是法律是一个低频需求,无法用续费率来衡量。如果是这样,如何确认产品的PMF?张惟师说,他们关注使用黏性,会看用户在用户有需求的时间窗口里,他跟“吾律”互动的频率和次数,是只问了一个问题就消失了,还是一直在问,直到问题被解决。


还有一个问题就是付费,张惟师不是没有答案,只是他觉得不急着给,他给自己形容叫做“克制的商业化”。


他完全可以分析用户的聊天记录,把有需求的转给律所去电话回访;可以在用户问了几句话之后就弹出“需要人工服务吗”,推律师撮合。这些是成熟的变现路径,做法律平台的同行大多在做。


他没有做。


“这跟我们的初心不符。”张惟师他们还在做AI自动化立案——这个功能很难,做出来可能也挣不到多少钱,但他们还是在做。甚至后面还打算推出“你敢用我敢赔”的功能。


商业化目标,今年下半年才开始追。但他花了八年时间,先把另一件事想清楚了:法律AI,到底应该是什么?到底该赚什么钱?

 

为什么要做法律垂类大模型


虎嗅:法律AI的赛道,Harvey已经是跑出来了,会有投资人问你们,是不是中国的Harvey,或者把你们和Harvey做对标吗?


张惟师:投资人有时候会问“你们会不会成为中国的 Harvey”,但幂律是 2017 年成立的,Harvey 是 2023 年才成立的,我们早了整整六年。我们分析下来,中美法律服务市场差异很大,直接对标这个路子是不对的。


虎嗅:幂律在成立之后做了哪些方向,后来又停了哪些?


张惟师:主要两条线:一是法条案件检索,但国家后来把数据开放了,而且这个赛道已经有做了十多年的巨头,门槛没了;二是律所端的知识管理系统,国内律师总数也就几十万,付费意愿不大,天花板很低。


我加入之后,这两条线都停了,专注做企业端。我们观察到大型企业在合同管理上还停留在 OA、发邮件附件这个水平,法务需要审查的合同量很大、类型很多,这是一个真实且没有被认真对待的痛点。


虎嗅:你们做企业端的时候,大模型还没有出来,大模型出来后,对公司来说有哪些比较关键的变化?


张惟师:最开始的产品逻辑是纯规则引擎加知识图谱,没有大模型可用,是树形结构的审查逻辑,要给合同加一个“分期付款”审查点,要搭几十个步骤,才能判断甲方是否在付款比例上让步太多,这套东西很费人,效果也有限。


大模型出来之后,我们开始孵化“吾律”这条产品线,面向中小企业和 C 端用户。这其实一直是我加入的初心,希望用科技让法律服务更普及,只是之前没有合适的 AI 能力,一直没动。大模型出来,时机成熟了。


虎嗅:大模型出来之后,你们是怎么判断哪些场景先被改造的,有哪些场景选择?


张惟师:是循序渐进的。最开始我们并没有把大模型当成推倒重来的理由,原来的产品还在交付,不能马上切换。我们先在一些局部子任务上试:合同里的信息抽取,发现大模型效果确实比传统深度学习好;合同起草,生成模型本来就擅长这个,效果不错。


到了 2024 年,我们发现模型能力进步很快,开始对合同审查做架构升级,而传统规则引擎和大模型混搭的路子越走越窄,很难激发大模型的潜力。最后还是要尽量依赖大模型,不能在旧框架上打补丁。基于多智能体架构重建了一套合同审查系统,比原来好很多。


虎嗅:法律 AI 对幻觉的容错率非常低,几乎要求零幻觉,幻觉问题怎么处理?


张惟师:幻觉不可能百分之百消除,人工审查也会出错。问题是怎么把它压在产品可容忍的范围内,不让幻觉发生在关键节点上。


我们用几个层面控制。第一是模型层,我们跟智谱合作训练了垂直法律大模型 PowerLaw GLM,融入了大量法条案件数据和服务过企业的优质合同数据,在法律场景下的幻觉天然比通用模型少。第二是架构层:多智能体架构,每个智能体专门负责一个子任务,最后有一个校验智能体对核心交付结果做二次 check——地址电话对不对、案号准不准确、文书有没有违法信息,没问题才发给用户。第三是数据闭环,用户复核修改的行为是很有价值的训练信号,AI 的原始结果和人工定稿之间的差异,我们定期分析,反过来优化模型。


虎嗅:公司整体的采购成本,大头在哪里?是给模型的 API 费用,还是人机结合那部分的人工成本?


张惟师:大头是云主机,加上我们自己布的跑法律大模型用的 GPU 集群。


API这块,实话说现在比之前便宜多了,成本还好。C 端产品偶尔会有用户很高频——比如有人一上午跟“吾律”聊了几百个问题,消耗了几千万 token,但这是少数。百万 token 的价格现在很便宜,整体下来不是大头。


还有一块是全员用 AI 工具的费用,我们现在全公司都在用 AI 写代码、出设计、写文档,这块公司按月给大家报销。程序员用量特别大,一不小心一上午就可能用了 100 美元,这块加起来也是成本。


虎嗅:自研了垂直法律大模型,这是一个比较重的投入,现在回头看这个决定对吗


张惟师:要站在当时的视角看,2023 年上半年做这个决策是因为通用大模型能力远没有现在强,让它回答一个法条问题、生成一个合同条款,基本是乱答的,那时候做垂直法律大模型非常有必要。但站在今天看,垂直大模型对整体产品效果的贡献度在衰减,这是实际情况。通用模型的能力已经在很多层面覆盖了垂直模型的优势。所以从 2025 年开始,我们不再做大规模增量训练,更多是做针对特定工具调用能力的微调,或者在私有化场景下用开源模型做法律数据的小幅训练。


所以2025年开始,我们做了一些调整,首先不做重成本的增量训练,改做两类轻量工作,一是针对特定工具调用能力的微调,比如把违约金计算工具的能力训进模型;二是私有化场景下,用开源模型做法律数据的小规模训练,解决私有部署环境下通用能力不足的问题。


核心场景还是用PowerLaw GLM,这是我们的“金刚钻”,未来的重点已经不是继续建超大基座的法律大模型了。


虎嗅:大模型能力提升之后,你们发现自研垂类模型的能力被大模型覆盖了,那么随着大模型越来越强,垂直厂商的壁垒到底在哪里?


张惟师:我们的判断是,壁垒主要有两点。


第一,对垂直场景更深入的理解。“吾律”是围绕中小企业和 C 端的法律场景设计的,真正帮用户交付结果,比如企业欠款追缴,我们从证据收集、催款函生成、盖章律师函,到 AI 打电话谈判,到写起诉状,到 AI 全流程自动化立案,这一套流程需要非常深的专业积累。立案时需要哪些材料、每个材料的格式,必须具备专业律师级别的知识才能过审。这些不是大模型能力提升就能自动解决的。

第二,对 AI 结果的服务保障和兜底能力。用户愿意付费,是因为想买一个可信任的服务结果。我们在做的是人机结合来兜底——AI 先交付,核心内容有专家审核功能,之后还会做“你敢用我敢赔”这样的服务升级。

 

模型贡献20%,剩下80%是Agentic的工作流


虎嗅:在你们的产品上,大模型自身的能力,和你们自己搭建的工作流的能力,各自贡献多少?


张惟师:这个比例在变。早期我们做垂直大模型的时候,可能觉得模型本身贡献了 60%,工作流和场景设计贡献 40%。但现在随着通用大模型能力的提升和技术普惠,模型本身对产品差异化能力的贡献度在往下走,工作流、场景理解、服务保障的重要性在往上升。以“吾律”为例,如果单聊对产品差异化能力的贡献度,现在我觉得可能是20%靠模型本身,80%靠围绕场景的工作流设计和服务能力,当然不同场景会有差异,合同审查这种专业场景,模型的贡献可能还稍微高一点。


虎嗅:你们自己衡量 PMF 的标准是什么?两条产品线各自看什么指标?


张惟师:不提钱的指标的话,两条线逻辑很不一样。


中大型企业这条线,我们早期最关注真实使用率。很多大企业采购了一套智能化系统,但其实根本没人用,或者用一下就放着了。


我们更关注的是:这家企业一年有 1 万份合同,上线之后真正走了 AI 审查流程的有多少?大家是真的在用,还是用传统方式在旁路操作?这个指标非常关键,因为它直接决定你后续二期三期项目的签约率,中大B产品真正的利润其实在二三期,第一期更多是打基础的。


中小企业和C端这条线,我们关注使用粘性,即在用户有需求的时间窗口里,他跟“吾律”互动的频率和次数。


法律需求是低频的,但高强度,用户遇到问题会很焦虑,那段时间他可能问几百个问题,我们就看在那个时间窗口内,他是问了一个问题就消失了,还是真的一直在用、问题被解决了。续费率更多是企业端的指标,C 端因为需求本身太低频,不太适合用续费来衡量。


虎嗅:你们做了 B 端和 C 端两条线,各自踩了哪些坑?


张惟师:中大型企业这条线,早期最大的坑是技术方案选型的问题。为了快速交付项目,代码堆积,不同项目之间复用率、可配置化都比较差,结果服务了几百家企业之后,我们要花将近一年时间重构,重新基于多智能体架构来做。


中小企业和 C 端这条线,踩的坑更多在营销端。最开始我们用做互联网 C 端的思路——邀请裂变、发会员奖励,但法律是低频且非常隐私的场景,用户不会主动把一个法律平台推荐给别人,裂变根本起不来。所以我们后来调整思路,不走烧钱投放,而是找渠道,找有大量企业资源的渠道,借他们的背书来推产品。


虎嗅:法律行业对信任的要求很高,如果是一个AI律师,怎么在用户侧建立信任?


张惟师:这是我们目前面临的最重要的问题之一。


从技术手段来说,多智能体互相校验、减少幻觉;从人机结合来说,我们开律师函这个场景,AI 起草,合作律师做复核再盖章,这本身就是一层信任背书;往后还会做人工专家审核功能,用户花很少的成本,我们的合作律师给出意见和修订版。最后是服务保障,例如“你敢用我敢赔”,这个承诺本身就是信任的来源。


虎嗅:你印象最深的用户案例是什么?


张惟师:武汉一个用户,跟一家人力资源公司有公积金纠纷,对方少替他的员工代缴了一个月的社保,他想起诉,但觉得找律师太贵,就自己用“吾律”试了试。


他先描述了案情,“吾律”帮他生成了起诉状和证据目录。他觉得可靠,就把公司的真实名称、对方公司的信息、截图一样一样发过来,“吾律”生成了完整的起诉状。他又问能不能帮他立案,“吾律”就告诉他怎么登录法院的在线服务网,告诉他每一页怎么填,每一个陌生的法律术语怎么选:民事审判立案还是执行立案,是合同纠纷还是买卖合同。到最后,他需要一份委托授权书,证明自己有权代表公司原告起诉,他把自己的身份证正反面照片发给了“吾律”——没有打任何码。“吾律”帮他生成了这份文件,他就立案成功了。


整个过程半天,跟“吾律”互动了 200 次左右,问了 80 多个问题。找律师的话,没有一周、几千块钱搞不定,而且他是新用户,我们那时候给的试用额度,在他身上没有赚到一分钱。但我们觉得他对“吾律”的信任,已经远超对一个 SaaS 工具的信任。


虎嗅:我看到之前有个叫“无忧吾律”的服务,这个产品和“吾律”是什么关系?


张惟师:“无忧吾律”是“吾律”的前身,但不是同一个产品。你可以理解成,我们一直想做吾律 AI 律师,但在做之前,我们得先自己去真正服务客户,只有把这些中小企业和 C 端用户亲手服务一遍,才知道他们真实的需求是什么,AI 在里面能起到什么作用。


“无忧吾律”是一个人机结合的法律顾问服务。我们在成都有一个法务团队,在无锡和华东一带签了几百家中小企业,作为他们的法务顾问。法务同学先用我们的 AI 系统提效,比如审合同、写法律意见书,AI 先出结果,人再做二次复核,最后发给用户,这个过程中还有微信群跟进服务,类似律所的方式,这是有人工成本的,所以我们的定价在大几千到一万出头,跟律所比其实已经很低了。


到去年我们觉得这套东西的 know-how 已经拿到了,大模型能力也到了一个新的阶段,就把这个模式升级成纯 AI 交付的产品,也就是现在的“吾律”。价格也降了很多,月会员 88 元,年会员 988 元,最高版才 1600 多。


虎嗅:幂律的数据飞轮是怎么建立的,什么阶段你发现它转起来了?


张惟师:数据飞轮分两块:数据收集和数据使用,形成闭环。


收集侧,除了公开数据,一方面是我们法务团队内部整理的专业知识数据,另一方面是客户授权后脱敏的合同数据。这两类数据质量比较高,可以直接作为大模型的memory 或者RAG 方式使用。

更有价值的是产品端用户真实的使用反馈数据。


比如大型企业的合同审查,AI 给出结果,人工复核,最后形成定稿——这个“AI 原始结果”和“人工定稿”之间的差异,我们在用户授权下会定期跑程序分析,把这些数据再喂给大模型,让模型下次审同类合同的时候,记住用户的审查偏好和习惯,这个过程可以循环起来。


“吾律”这端一样,我们用 AI 自动分析用户的使用数据,用户问到哪里不问了,哪里点了赞,哪里在吐槽,定期做自动化分析,让模型更准确。

 

克制的商业化


虎嗅:你认为未来幂律的竞争对手可能会来自什么类型的公司?


张惟师:中大型企业的合同审查这条线,竞品比较多,比如原来的大 OA 厂商、专门做合同的垂直厂商。


中小企业和 C 端这条线,目前我们还没有发现可能的竞争对手。其他家大多还停留在 SaaS 工具属性,做不到真正帮用户交付问题——比如开盖章版律师函,现在没有一家法律 AI 产品能在线上直接开出来,我们已经可以做了,成本一百块钱不到。


大厂方面,法律这个场景对大厂来说可能不够性感,频次低、裂变效应差,不是他们投入的重点。


虎嗅:创业这几年有没有特别至暗的时刻?


张惟师:2023 年上半年。


那时候大模型刚出来,投资人和客户对你的期待都变了——他们想看你怎么用大模型,但我们当时老产品还没有来得及用大模型改造,新产品也没出来,账上上一轮融资的钱基本快花光了。


总之是硬撑过来的,核心团队一直坚持住了。2023 年 6 月,我们推出了 PowerLaw GLM 这个垂直法律大模型,做了一个对话产品的 demo。2023 年 8 月,我们拿到了 8000 万的融资,蓝驰领投——这笔钱目前还是法律科技赛道最大的单笔融资。有了这个缓冲,我们才能一边重构老产品,一边继续推进“吾律”。到 2024 年,公司整体营收才真正步入正轨。


经历那段时间之后,团队对成本控制、商业化节奏、研发创新之间的平衡,认知都深了很多。


虎嗅:如果非要说一个后悔的决定,是什么?


张惟师:如果非要选,是 2023 年大模型出来之后,我们把合同审查产品向大模型迁移的速度大概慢了半年。


原因有两个:一是我作为 CTO 对大模型能力提升速度的判断还不够准确;二是技术方案的路径依赖——原来那套基于规则引擎的方案做了很久,当时有一些待交付的项目,为了保交付保效果,不太敢用激进的新方案,局内人的自我革命是比较难的。


慢了半年的代价是,市面上出现了一些没有技术包袱的竞品,律师出身、文科背景,直接在大模型上面配上自己的审查 know-how 就扔进去,效果在当时看起来异常好。


但这种产品门槛低,我们意识到问题之后用了一个季度左右就追上来了。


虎嗅:现在最焦虑的是什么?


张惟师:技术和产品这块我有信心,做了这么多年了。最焦虑的是营销——怎么打品牌、怎么推广、怎么让更多人知道“吾律”。这不是我的专长,但做面向大众的产品,这块又特别重要。


虎嗅:AI 最终会替代律师吗?


张惟师:我们做“吾律”的出发点从来不是取代律师,而是基于 AI 和人工律师各自的优劣势来做分工。有些事适合 AI 做:基础性、高频的法律咨询,开律师函,起草合同,起诉状生成——律师本来也是花时间换收入,现在 AI 来了,这块的收入律师确实赚不到了。但有些事只能律师做:开庭、线下处理复杂案件、个性化高端业务——AI 做不了,律师的价值不可或缺。


我们的判断是,未来法律服务会形成三层结构:第一层是 AI 律师和法律服务智能化平台,端到端解决用户的共性基础问题,同时积累案件线索;第二层是给专业法律人赋能提效的工具;第三层是律师处理复杂个性化高端业务,可以和第一层的 AI 平台合作接案源。


这个模式我们现在已经在小规模运转了,“吾律”每天产生一些需要人工服务的工单,转给合作律所来承接。这不是未来,这是现在正在发生的事。


虎嗅:商业化这块,幂律达到你自己的预期了吗?


张惟师:中大型企业这条线做得不错,合同产线基本盈亏平衡,这条线是相对健康的。“吾律”这条新产品线,我们现在还是在关注用户增长和产品体验,还没有特别关注商业化。今年下半年,或者明年上半年,我们预期会开始定商业化的目标——会员体系、盖章版律师函、人工专家审核功能,这些口子要做好,让愿意付费的用户找到值得付的地方。


虎嗅:你自己的产品品味体现在哪里?


张惟师:“克制的商业化”。比如我们现在其实有很多可以快速变现的方式,比如分析用户聊天记录,把有需求的转给合作律所去电话回访;或者在用户问了几句话之后马上弹出“需要人工服务吗”,推律师撮合,这些都能快速挣钱。我没有做这个,因为这跟我们的初心不符。我们坚持要用 AI 去尽量帮用户解决问题,即使有些场景 AI 做了挣不到钱,我们也坚持做。比如 AI 自动化立案,这个很难,真的做出来可能挣不到多少钱,但我们还是在做。


虎嗅:如果幂律未来走不下去,最大的原因可能是什么?


张惟师:可能是团队。几个创始人年龄都在增长,我今年40 了,我们的CEO也快36岁了,再过几年,可能会跟不上年轻人的思维,跟不上用户和市场的反馈,被市场淘汰。我们要保持开放和学习,这是我们每天都在有意识地去做的事情。



文章标题:他们想做让14亿中国人都用得起的“律师”

文章链接:https://www.huxiu.com/article/4850995.html

阅读原文:他们想做让14亿中国人都用得起的“律师”_虎嗅网
AI原生产品日报频道: 前沿科技
本内容未经允许不得转载。授权事宜请联系 hezuo@huxiu.com。
正在改变与想要改变世界的人,都在虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定