原创2026-04-21 16:42

他们想做让14亿中国人都用得起的“律师”

陈伊凡_YF

出品｜虎嗅科技组

作者｜陈伊凡

编辑｜苗正卿

头图｜AI生成

“AI原生100”是虎嗅科技组推出针对AI原生创新栏目，这是本系列的第「52」篇文章。

中国有约83万名执业律师，服务14亿人口，每1700人摊到一名律师，大约是美国的七分之一。大多数中国人一生中不会主动联系律师，找不到门，也付不起钱。

张惟师认为，这是一个商业机会。他是幂律智能的联合创始人兼CTO，这家法律AI公司背后站着线性资本、蓝驰创投、源码资本、红杉资本等头部机构。这也是中国第一个商业化的法律AI大模型公司。

今年，是幂律成立后的第8年。

说起幂律的成长，2023都是一个避不开的时间点。那一年上半年，大模型出来了。投资人想看新东西，客户也想看新东西，但幂律的老产品——企业合同审查系统还没来得及用大模型改造，新产品也没出来，账上上一轮融资的钱快花完了。

“青黄不接”，张惟师后来形容那段时间是“硬撑过来的。”

转机出现在当年6月：在决定向大模型转型后，幂律推出了垂直法律大模型PowerLaw GLM，做了一个对话产品的demo。两个月后，拿到了8000万融资，蓝驰领投——这笔钱，是中国法律科技赛道迄今最大的单笔融资。

也是在这一年，一家叫Harvey的公司在大西洋另一端成立了。如今Harvey年收入1.9亿美元，估值92亿美元，获得了Sequoia、a16z、OpenAI累计接近10亿美元的投资，服务全球顶级律所，是法律AI赛道最炙手可热的名字。

投资人时常问幂律一个问题：“你们是中国的Harvey吗？”

每次都被张惟师否定了，幂律就是幂律，比Harvey早了整整六年。而且走的不是同一条路。

幂律智能团队照片图片由幂律智能提供

Harvey服务的是大律所——美国律师付费意愿强，事务所愿意花钱买提效工具，订阅制跑得起来。

幂律想做的是另一件事：用科技让法律服务触达那些根本没有“法律意识”的普通人和中小企业。中国有几千万家中小企业，遇到合同纠纷、劳动争议、债权追讨，要么忍着，要么摸索，鲜少有人知道自己的权利，也付不起律师费。

两个方向，是不同土壤中长出的不同的结果。

在法律AI这个赛道，有几个问题是每家公司都绕不过去的：要不要训练垂类模型？如何防止幻觉？内部怎么评估AI质量？在这种强信任的赛道，如何权衡人类律师和AI律师之间的界限？

幂律拿到8000万之后干的第一件事，不是扩张，是重构。除了之前B端的合同审查系统，内部开始孵化“吾律”这个项目。

为了消除幻觉，他们和智谱合作，训练法律垂类模型PowerLaw GLM。

一家初创公司，一上来就训练垂类模型，是一项很重的投入。张惟师说，在2023年，通用大模型能力还没有上来的时候，做垂类模型是非常有必要的，跟智谱合作在GLM3上做法律增量训练，“在当时是难得的资源”。因为在那个时期，市面上涌现许多法律AI团队，律师背景、不懂工程——直接把自己的法律知识喂给大模型就出产品了。

但站在今天，随着大模型能力的提升，幂律不再需要做重成本的增量训练，转向两类轻量工作：针对特定工具调用能力的微调，以及私有化场景下的小规模法律数据训练。

这项AI产品的核心价值有多少来自模型本身，又有多少在基于对法律行业认知上搭建的Agentic workflow 或认知架构？张惟师说，过去是60%来自模型本身，40%来自Agentic的工作流，但现在来看，则反过来了。80%来自Agentic的工作流，20%来自模型本身。

这句话背后意味着，模型的贡献越来越小，而80%则是对法律场景和业务流程足够理解，是大量真实案件积累出来的工作流，是让AI结果可信赖、可兜底的服务体系。这些东西不是算力能买来的，也不是靠模型升级能直接替代的。

“吾律”不是工具。在张惟师的设想中，它可以完成承担一个AI律师的角色。支撑这种信任的，是一套持续运转的数据闭环：AI给出结果，用户复核修改，“原始结果”和“人工定稿”之间的差异，幂律会定期跑程序分析，再反过来优化模型。这是他们的内部评估体系，也是数据飞轮转起来的方式。

不过针对C端和中小客户的法律AI产品，有一个问题是区别于其他ToC的AI产品，那就是法律是一个低频需求，无法用续费率来衡量。如果是这样，如何确认产品的PMF？张惟师说，他们关注使用黏性，会看用户在用户有需求的时间窗口里，他跟“吾律”互动的频率和次数，是只问了一个问题就消失了，还是一直在问，直到问题被解决。

还有一个问题就是付费，张惟师不是没有答案，只是他觉得不急着给，他给自己形容叫做“克制的商业化”。

他完全可以分析用户的聊天记录，把有需求的转给律所去电话回访；可以在用户问了几句话之后就弹出“需要人工服务吗”，推律师撮合。这些是成熟的变现路径，做法律平台的同行大多在做。

他没有做。

“这跟我们的初心不符。”张惟师他们还在做AI自动化立案——这个功能很难，做出来可能也挣不到多少钱，但他们还是在做。甚至后面还打算推出“你敢用我敢赔”的功能。

商业化目标，今年下半年才开始追。但他花了八年时间，先把另一件事想清楚了：法律AI，到底应该是什么？到底该赚什么钱？

为什么要做法律垂类大模型

虎嗅：法律AI的赛道，Harvey已经是跑出来了，会有投资人问你们，是不是中国的Harvey，或者把你们和Harvey做对标吗？

张惟师：投资人有时候会问“你们会不会成为中国的 Harvey”，但幂律是 2017 年成立的，Harvey 是 2023 年才成立的，我们早了整整六年。我们分析下来，中美法律服务市场差异很大，直接对标这个路子是不对的。

虎嗅：幂律在成立之后做了哪些方向，后来又停了哪些？

张惟师：主要两条线：一是法条案件检索，但国家后来把数据开放了，而且这个赛道已经有做了十多年的巨头，门槛没了；二是律所端的知识管理系统，国内律师总数也就几十万，付费意愿不大，天花板很低。

我加入之后，这两条线都停了，专注做企业端。我们观察到大型企业在合同管理上还停留在 OA、发邮件附件这个水平，法务需要审查的合同量很大、类型很多，这是一个真实且没有被认真对待的痛点。

虎嗅：你们做企业端的时候，大模型还没有出来，大模型出来后，对公司来说有哪些比较关键的变化？

张惟师：最开始的产品逻辑是纯规则引擎加知识图谱，没有大模型可用，是树形结构的审查逻辑，要给合同加一个“分期付款”审查点，要搭几十个步骤，才能判断甲方是否在付款比例上让步太多，这套东西很费人，效果也有限。

大模型出来之后，我们开始孵化“吾律”这条产品线，面向中小企业和 C 端用户。这其实一直是我加入的初心，希望用科技让法律服务更普及，只是之前没有合适的 AI 能力，一直没动。大模型出来，时机成熟了。

虎嗅：大模型出来之后，你们是怎么判断哪些场景先被改造的，有哪些场景选择？

张惟师：是循序渐进的。最开始我们并没有把大模型当成推倒重来的理由，原来的产品还在交付，不能马上切换。我们先在一些局部子任务上试：合同里的信息抽取，发现大模型效果确实比传统深度学习好；合同起草，生成模型本来就擅长这个，效果不错。

到了 2024 年，我们发现模型能力进步很快，开始对合同审查做架构升级，而传统规则引擎和大模型混搭的路子越走越窄，很难激发大模型的潜力。最后还是要尽量依赖大模型，不能在旧框架上打补丁。基于多智能体架构重建了一套合同审查系统，比原来好很多。

虎嗅：法律 AI 对幻觉的容错率非常低，几乎要求零幻觉，幻觉问题怎么处理？

张惟师：幻觉不可能百分之百消除，人工审查也会出错。问题是怎么把它压在产品可容忍的范围内，不让幻觉发生在关键节点上。

我们用几个层面控制。第一是模型层，我们跟智谱合作训练了垂直法律大模型 PowerLaw GLM，融入了大量法条案件数据和服务过企业的优质合同数据，在法律场景下的幻觉天然比通用模型少。第二是架构层：多智能体架构，每个智能体专门负责一个子任务，最后有一个校验智能体对核心交付结果做二次 check——地址电话对不对、案号准不准确、文书有没有违法信息，没问题才发给用户。第三是数据闭环，用户复核修改的行为是很有价值的训练信号，AI 的原始结果和人工定稿之间的差异，我们定期分析，反过来优化模型。

虎嗅：公司整体的采购成本，大头在哪里？是给模型的 API 费用，还是人机结合那部分的人工成本？

张惟师：大头是云主机，加上我们自己布的跑法律大模型用的 GPU 集群。

API这块，实话说现在比之前便宜多了，成本还好。C 端产品偶尔会有用户很高频——比如有人一上午跟“吾律”聊了几百个问题，消耗了几千万 token，但这是少数。百万 token 的价格现在很便宜，整体下来不是大头。

还有一块是全员用 AI 工具的费用，我们现在全公司都在用 AI 写代码、出设计、写文档，这块公司按月给大家报销。程序员用量特别大，一不小心一上午就可能用了 100 美元，这块加起来也是成本。

虎嗅：自研了垂直法律大模型，这是一个比较重的投入，现在回头看这个决定对吗？

张惟师：要站在当时的视角看，2023 年上半年做这个决策是因为通用大模型能力远没有现在强，让它回答一个法条问题、生成一个合同条款，基本是乱答的，那时候做垂直法律大模型非常有必要。但站在今天看，垂直大模型对整体产品效果的贡献度在衰减，这是实际情况。通用模型的能力已经在很多层面覆盖了垂直模型的优势。所以从 2025 年开始，我们不再做大规模增量训练，更多是做针对特定工具调用能力的微调，或者在私有化场景下用开源模型做法律数据的小幅训练。

所以2025年开始，我们做了一些调整，首先不做重成本的增量训练，改做两类轻量工作，一是针对特定工具调用能力的微调，比如把违约金计算工具的能力训进模型；二是私有化场景下，用开源模型做法律数据的小规模训练，解决私有部署环境下通用能力不足的问题。

核心场景还是用PowerLaw GLM，这是我们的“金刚钻”，未来的重点已经不是继续建超大基座的法律大模型了。

虎嗅：大模型能力提升之后，你们发现自研垂类模型的能力被大模型覆盖了，那么随着大模型越来越强，垂直厂商的壁垒到底在哪里？

张惟师：我们的判断是，壁垒主要有两点。

第一，对垂直场景更深入的理解。“吾律”是围绕中小企业和 C 端的法律场景设计的，真正帮用户交付结果，比如企业欠款追缴，我们从证据收集、催款函生成、盖章律师函，到 AI 打电话谈判，到写起诉状，到 AI 全流程自动化立案，这一套流程需要非常深的专业积累。立案时需要哪些材料、每个材料的格式，必须具备专业律师级别的知识才能过审。这些不是大模型能力提升就能自动解决的。

第二，对 AI 结果的服务保障和兜底能力。用户愿意付费，是因为想买一个可信任的服务结果。我们在做的是人机结合来兜底——AI 先交付，核心内容有专家审核功能，之后还会做“你敢用我敢赔”这样的服务升级。

模型贡献20%，剩下80%是Agentic的工作流

虎嗅：在你们的产品上，大模型自身的能力，和你们自己搭建的工作流的能力，各自贡献多少？

张惟师：这个比例在变。早期我们做垂直大模型的时候，可能觉得模型本身贡献了 60%，工作流和场景设计贡献 40%。但现在随着通用大模型能力的提升和技术普惠，模型本身对产品差异化能力的贡献度在往下走，工作流、场景理解、服务保障的重要性在往上升。以“吾律”为例，如果单聊对产品差异化能力的贡献度，现在我觉得可能是20%靠模型本身，80%靠围绕场景的工作流设计和服务能力，当然不同场景会有差异，合同审查这种专业场景，模型的贡献可能还稍微高一点。

虎嗅：你们自己衡量 PMF 的标准是什么？两条产品线各自看什么指标？

张惟师：不提钱的指标的话，两条线逻辑很不一样。

中大型企业这条线，我们早期最关注真实使用率。很多大企业采购了一套智能化系统，但其实根本没人用，或者用一下就放着了。

我们更关注的是：这家企业一年有 1 万份合同，上线之后真正走了 AI 审查流程的有多少？大家是真的在用，还是用传统方式在旁路操作？这个指标非常关键，因为它直接决定你后续二期三期项目的签约率，中大B产品真正的利润其实在二三期，第一期更多是打基础的。

中小企业和C端这条线，我们关注使用粘性，即在用户有需求的时间窗口里，他跟“吾律”互动的频率和次数。

法律需求是低频的，但高强度，用户遇到问题会很焦虑，那段时间他可能问几百个问题，我们就看在那个时间窗口内，他是问了一个问题就消失了，还是真的一直在用、问题被解决了。续费率更多是企业端的指标，C 端因为需求本身太低频，不太适合用续费来衡量。

虎嗅：你们做了 B 端和 C 端两条线，各自踩了哪些坑？

张惟师：中大型企业这条线，早期最大的坑是技术方案选型的问题。为了快速交付项目，代码堆积，不同项目之间复用率、可配置化都比较差，结果服务了几百家企业之后，我们要花将近一年时间重构，重新基于多智能体架构来做。

中小企业和 C 端这条线，踩的坑更多在营销端。最开始我们用做互联网 C 端的思路——邀请裂变、发会员奖励，但法律是低频且非常隐私的场景，用户不会主动把一个法律平台推荐给别人，裂变根本起不来。所以我们后来调整思路，不走烧钱投放，而是找渠道，找有大量企业资源的渠道，借他们的背书来推产品。

虎嗅：法律行业对信任的要求很高，如果是一个AI律师，怎么在用户侧建立信任？

张惟师：这是我们目前面临的最重要的问题之一。

从技术手段来说，多智能体互相校验、减少幻觉；从人机结合来说，我们开律师函这个场景，AI 起草，合作律师做复核再盖章，这本身就是一层信任背书；往后还会做人工专家审核功能，用户花很少的成本，我们的合作律师给出意见和修订版。最后是服务保障，例如“你敢用我敢赔”，这个承诺本身就是信任的来源。

虎嗅：你印象最深的用户案例是什么？

张惟师：武汉一个用户，跟一家人力资源公司有公积金纠纷，对方少替他的员工代缴了一个月的社保，他想起诉，但觉得找律师太贵，就自己用“吾律”试了试。

他先描述了案情，“吾律”帮他生成了起诉状和证据目录。他觉得可靠，就把公司的真实名称、对方公司的信息、截图一样一样发过来，“吾律”生成了完整的起诉状。他又问能不能帮他立案，“吾律”就告诉他怎么登录法院的在线服务网，告诉他每一页怎么填，每一个陌生的法律术语怎么选：民事审判立案还是执行立案，是合同纠纷还是买卖合同。到最后，他需要一份委托授权书，证明自己有权代表公司原告起诉，他把自己的身份证正反面照片发给了“吾律”——没有打任何码。“吾律”帮他生成了这份文件，他就立案成功了。

整个过程半天，跟“吾律”互动了 200 次左右，问了 80 多个问题。找律师的话，没有一周、几千块钱搞不定，而且他是新用户，我们那时候给的试用额度，在他身上没有赚到一分钱。但我们觉得他对“吾律”的信任，已经远超对一个 SaaS 工具的信任。

虎嗅：我看到之前有个叫“无忧吾律”的服务，这个产品和“吾律”是什么关系？

张惟师：“无忧吾律”是“吾律”的前身，但不是同一个产品。你可以理解成，我们一直想做吾律 AI 律师，但在做之前，我们得先自己去真正服务客户，只有把这些中小企业和 C 端用户亲手服务一遍，才知道他们真实的需求是什么，AI 在里面能起到什么作用。

“无忧吾律”是一个人机结合的法律顾问服务。我们在成都有一个法务团队，在无锡和华东一带签了几百家中小企业，作为他们的法务顾问。法务同学先用我们的 AI 系统提效，比如审合同、写法律意见书，AI 先出结果，人再做二次复核，最后发给用户，这个过程中还有微信群跟进服务，类似律所的方式，这是有人工成本的，所以我们的定价在大几千到一万出头，跟律所比其实已经很低了。

到去年我们觉得这套东西的 know-how 已经拿到了，大模型能力也到了一个新的阶段，就把这个模式升级成纯 AI 交付的产品，也就是现在的“吾律”。价格也降了很多，月会员 88 元，年会员 988 元，最高版才 1600 多。

虎嗅：幂律的数据飞轮是怎么建立的，什么阶段你发现它转起来了？

张惟师：数据飞轮分两块：数据收集和数据使用，形成闭环。

收集侧，除了公开数据，一方面是我们法务团队内部整理的专业知识数据，另一方面是客户授权后脱敏的合同数据。这两类数据质量比较高，可以直接作为大模型的memory 或者RAG 方式使用。

更有价值的是产品端用户真实的使用反馈数据。

比如大型企业的合同审查，AI 给出结果，人工复核，最后形成定稿——这个“AI 原始结果”和“人工定稿”之间的差异，我们在用户授权下会定期跑程序分析，把这些数据再喂给大模型，让模型下次审同类合同的时候，记住用户的审查偏好和习惯，这个过程可以循环起来。

“吾律”这端一样，我们用 AI 自动分析用户的使用数据，用户问到哪里不问了，哪里点了赞，哪里在吐槽，定期做自动化分析，让模型更准确。

克制的商业化

虎嗅：你认为未来幂律的竞争对手可能会来自什么类型的公司？

张惟师：中大型企业的合同审查这条线，竞品比较多，比如原来的大 OA 厂商、专门做合同的垂直厂商。

中小企业和 C 端这条线，目前我们还没有发现可能的竞争对手。其他家大多还停留在 SaaS 工具属性，做不到真正帮用户交付问题——比如开盖章版律师函，现在没有一家法律 AI 产品能在线上直接开出来，我们已经可以做了，成本一百块钱不到。

大厂方面，法律这个场景对大厂来说可能不够性感，频次低、裂变效应差，不是他们投入的重点。

虎嗅：创业这几年有没有特别至暗的时刻？

张惟师：2023 年上半年。

那时候大模型刚出来，投资人和客户对你的期待都变了——他们想看你怎么用大模型，但我们当时老产品还没有来得及用大模型改造，新产品也没出来，账上上一轮融资的钱基本快花光了。

总之是硬撑过来的，核心团队一直坚持住了。2023 年 6 月，我们推出了 PowerLaw GLM 这个垂直法律大模型，做了一个对话产品的 demo。2023 年 8 月，我们拿到了 8000 万的融资，蓝驰领投——这笔钱目前还是法律科技赛道最大的单笔融资。有了这个缓冲，我们才能一边重构老产品，一边继续推进“吾律”。到 2024 年，公司整体营收才真正步入正轨。

经历那段时间之后，团队对成本控制、商业化节奏、研发创新之间的平衡，认知都深了很多。

虎嗅：如果非要说一个后悔的决定，是什么？

张惟师：如果非要选，是 2023 年大模型出来之后，我们把合同审查产品向大模型迁移的速度大概慢了半年。

原因有两个：一是我作为 CTO 对大模型能力提升速度的判断还不够准确；二是技术方案的路径依赖——原来那套基于规则引擎的方案做了很久，当时有一些待交付的项目，为了保交付保效果，不太敢用激进的新方案，局内人的自我革命是比较难的。

慢了半年的代价是，市面上出现了一些没有技术包袱的竞品，律师出身、文科背景，直接在大模型上面配上自己的审查 know-how 就扔进去，效果在当时看起来异常好。

但这种产品门槛低，我们意识到问题之后用了一个季度左右就追上来了。

虎嗅：现在最焦虑的是什么？

张惟师：技术和产品这块我有信心，做了这么多年了。最焦虑的是营销——怎么打品牌、怎么推广、怎么让更多人知道“吾律”。这不是我的专长，但做面向大众的产品，这块又特别重要。

虎嗅：AI 最终会替代律师吗？

张惟师：我们做“吾律”的出发点从来不是取代律师，而是基于 AI 和人工律师各自的优劣势来做分工。有些事适合 AI 做：基础性、高频的法律咨询，开律师函，起草合同，起诉状生成——律师本来也是花时间换收入，现在 AI 来了，这块的收入律师确实赚不到了。但有些事只能律师做：开庭、线下处理复杂案件、个性化高端业务——AI 做不了，律师的价值不可或缺。

我们的判断是，未来法律服务会形成三层结构：第一层是 AI 律师和法律服务智能化平台，端到端解决用户的共性基础问题，同时积累案件线索；第二层是给专业法律人赋能提效的工具；第三层是律师处理复杂个性化高端业务，可以和第一层的 AI 平台合作接案源。

这个模式我们现在已经在小规模运转了，“吾律”每天产生一些需要人工服务的工单，转给合作律所来承接。这不是未来，这是现在正在发生的事。

虎嗅：商业化这块，幂律达到你自己的预期了吗？

张惟师：中大型企业这条线做得不错，合同产线基本盈亏平衡，这条线是相对健康的。“吾律”这条新产品线，我们现在还是在关注用户增长和产品体验，还没有特别关注商业化。今年下半年，或者明年上半年，我们预期会开始定商业化的目标——会员体系、盖章版律师函、人工专家审核功能，这些口子要做好，让愿意付费的用户找到值得付的地方。

虎嗅：你自己的产品品味体现在哪里？

张惟师：“克制的商业化”。比如我们现在其实有很多可以快速变现的方式，比如分析用户聊天记录，把有需求的转给合作律所去电话回访；或者在用户问了几句话之后马上弹出“需要人工服务吗”，推律师撮合，这些都能快速挣钱。我没有做这个，因为这跟我们的初心不符。我们坚持要用 AI 去尽量帮用户解决问题，即使有些场景 AI 做了挣不到钱，我们也坚持做。比如 AI 自动化立案，这个很难，真的做出来可能挣不到多少钱，但我们还是在做。

虎嗅：如果幂律未来走不下去，最大的原因可能是什么？

张惟师：可能是团队。几个创始人年龄都在增长，我今年40 了，我们的CEO也快36岁了，再过几年，可能会跟不上年轻人的思维，跟不上用户和市场的反馈，被市场淘汰。我们要保持开放和学习，这是我们每天都在有意识地去做的事情。

文章标题：他们想做让14亿中国人都用得起的“律师”

文章链接：https://www.huxiu.com/article/4850995.html

阅读原文：他们想做让14亿中国人都用得起的“律师”_虎嗅网

AI原生产品日报频道: 前沿科技

陈伊凡_YF

见证、记录

虎嗅团队

已在虎嗅发表 104 篇文章

本内容未经允许不得转载。授权事宜请联系 hezuo@huxiu.com。

正在改变与想要改变世界的人，都在虎嗅APP

赞赏

支持一下修改

确定