靠扒“脏”数据,这家公司干到估值数亿
原创2026-01-17 18:11

靠扒“脏”数据,这家公司干到估值数亿

出品|虎嗅科技组

作者|陈伊凡

编辑|苗正卿

头图|视觉中国


“AI原生100”是虎嗅科技组推出针对AI原生创新栏目,这是本系列的第「41」篇文章。


一家中国的初创公司正在试图证明,在最为传统的服装制造业,人工智能能够完成上一代数字化技术未竟的事业。

 

在东莞长安镇一间地毯工厂,当下的现实与数字化理想正在进行一场略显尴尬的碰撞。

 

七八位工人站在梯子上,拿着机枪在地毯上进行走线,工厂里一间简陋的小屋,是设计师工作室,摆着的是一张手绘的地毯样式。出了工厂另一边的单间,摆放着一台五米高的自动打孔机的样机,对着面前的地毯,尝试按照图样进行走线布局,来人的时候,工人会打开这台样机,笨拙演示,这种机器效果远不如人工,老板似乎也并没有打算把它用到自己的产线。

 

这是虎嗅曾经走访过的一家地毯厂商所看到的图景,这台五米高的昂贵机器,成为了服装行业上一轮数字化转型困境的缩影。

 

改造服装行业,听起来就没有那么性感,当然也不时髦。这是一个由无数作坊、碎片化数据和个人经验拼凑而成的古老行当。但周栋和团队在这件事上,已经跑了好几年,将这件事做到估值数亿元。

 

他们拥有服装行业规模最大的数据库和全国唯一服装产业垂直大模型的备案资质,申洲国际、即发集团、酷特智能、迪尚集团等中国制造的隐形冠军,均在其客户之列。

 

向量螺旋所解决的,是服装全产业链(从最上游的材料,例如棉花,到面料厂、服装厂再到品牌商)的沟通问题,再精准一些,就是解决信息增益,把AI变成实质生产力,而不是生产工具

 

这件事曾经许多服装3D厂商尝试,韩国的CLO最早步入服装3D行业,不过3D和AI存在本质区别,其中一个最大区别就是成本。3D技术,通过物理设备扫描进3D空间,再进行建模和渲染,最终还原出真实物理特性。还原的精度和真实性是早期AI不可及的,但存在的问题是成本极高。购买这套3D建模软件的工厂或是品牌方,需要为这套软件匹配相应的岗位,比如建模师、渲染。另外,3D不具备创造性和泛化性,其作用在于基于面料进行还原和款式设计。

 

如今,一些服装3D技术解决方案提供商也提出要进入AI时代,但这意味着他们也需要和向量螺旋一样,重走一遍数据积累、领域算法、模型训练的过程。因为3D的数据和底层技术架构和生成式AI,完全不同。

 

见面之前,他刚结束和投资人的会谈。在向量螺旋过往的投资者名单中,几乎都是产业基金与国资背景的机构。

 

周栋并非典型的极客创业者。拥有媒体背景、家族在潮汕经营服装工厂的他,与其联合创始人邢方舟起初的生意也相当传统:为网红KOL提供服装柔性定制。这门生意虽然有利可图,却很难称得上有巨大的想象空间。


向量螺旋的团建

 

但有的时候,往往这些不那么“性感”的故事,反而能够撇去浮华,触碰到商业真正发挥价值的土壤。

 

对周栋和邢方舟的青岛向量螺旋而言,最关键的是2021年,前海信人工智能商用研究所所长马映辉的加入,为这家传统的数字化公司注入了真正的技术基因。彼时,GPT的概念虽已问世,但尚未引发全球狂热。马映辉带来的不仅是技术,而是一种视角的转换。

 

面料商谈论的是克重与材质,加工厂关注的是走线与工艺,而品牌方高谈阔论的则是调性与风格。这种语言体系的割裂,导致了巨大的沟通成本和供需错配。

 

既然创业的初衷是在服装领域找到一个新的技术变量,去解决传统产业的生产力或结构关系问题,而看起来这个叫做“GPT”的AI似乎有希望,周栋他们决定试一试。而事实上也证明,服装行业或许可以跳过冗长的SaaS普及阶段,直接跃迁至AI时代。

 

训练AI需要数据,而这正是服装行业最匮乏的资源。在这个极其依赖非标经验的行业里,真正的数字化企业(如李宁、安踏、申洲国际)占比不足1%。对于绝大多数中小企业甚至是服装作坊而言,微信就是他们唯一的数字化管理系统。

 

于是,向量螺旋开始了漫长的“脏活”阶段。由于缺乏现成的结构化数据,团队不得不采取最原始的方式:爬取全球互联网上的公开图文;向产业伙伴定向搜集,甚至亲自深入工厂,拍摄纸质版单,再通过人工清洗将其转化为计算机可读的“配对数据”,即包含面料、设计稿、成品图及模特上身图的完整数据链。

 

在通用大模型眼里,一件衣服只是一堆像素的集合;但在向量螺旋的数据库中,一件衣服是一条严丝合缝的逻辑链:一张面料的显微照片,必须对应一份结构化的设计手稿,再成为一张成衣的工业版单,最后成为模特的上身效果图。

 

这种“四位一体”的数据结构,正是上一代数字化转型失败的症结所在,因为彼时系统只能处理孤立的数字,无法理解需要深入行业的行话——例如由于面料克重变化而导致的垂感差异。而周栋他们所做的,是通过数百万组这样的配对数据,训练AI,掌握一种行业通用的话语体系。

 

这场“脏累活”耗时两三年,数据就绪之后,他们选择了日本市场作为切入点,验证自己的初步应用产品能力。截至今日,他们在日本的客户已经有了数百家,第一阶段的PMF的验证成功,他们着手进入中国市场。花了两个月时间,他们进入了申洲国际的供应链。

 

未来的AI 应用服务引擎,在周栋的计划中,将会是一个“技术中台”,一个提炼了行业Knowhow和工程化经验,能将非标需求沉淀为标准化技术模组的交付平台。

 

服装行业可以直接跳过SaaS进入AI时代

 

虎嗅:你们在2021年转型开始做垂直领域的AITOB ,是因为业务发生了一些变化还是因为发现大模型出来了?

 

周栋:两方面都有。我们最开始做的是给市面上所有KOL提供一站式服装定制服务。当时的出发点是,2019到2020年,自媒体在各个渠道,公众号、抖音、B站等都发展得很迅猛,因为自媒体的变现方式发生变化,很多大V开始做电商,偏向做个人IP或品牌文创,服装则是比较容易切入的品类。但当时市面上没有一家服务商,既能搞定服装产业链,又能把不同IP的文化转化为服装设计,还能整合全部供应链提供服务,最开始我们就切入这个方向。

 

2021年底,我和搭档都在思考:继续做下去的这个市场规模是否足够大。另外,我们还是觉得这个业务不够性感。

 

我们创业的初衷,就是想在服装领域找到新的技术变量,尝试解决传统产业的生产关系或结构问题。

 

虎嗅:什么契机促使你坚定转型?

 

周栋:真正坚定转型是在2021年底,我们请到了一个关键人物前青岛海信人工智能商用研究所所长马映辉,就是现在公司的CTO,他一直对产业AI很感兴趣。他加入后,跟我们提到了类似GPT这样的东西,和更多有关计算机视觉方面的思考。

 

虎嗅:你怎么判断这是一个行业的真问题或者真正痛点?

 

周栋:服装行业链条特别长、涉及主体特别多,行业内最大的问题就是各方的语言和共识体系完全不一样。


这带来的最显性后果就是行业上中下游的沟通效率和共识效率极低,这就引出了行业最本质的矛盾问题:任何上下游两端甚至多端的供需交易效率低。

 

虎嗅:这件事在SaaS时期为什么没被解决?


周栋:没有。因为我刚才说的是行业最底层的本质矛盾,而从这个矛盾再往下抽象,造成这个问题的原因有这几点。

 

第一,服装行业是所有实体产业里最非标的一个。我刚才介绍的产业链条里有多个环节,每个环节在我看来都是一个独立行业,面料是一个行业,加工是一个行业,品牌是一个行业,零售是一个行业。

 

这带来的第一个问题是企业组织结构差异极大,不像互联网公司那样分工明确:运营就是运营,产品就是产品,研发就是研发。在服装领域,你经常会看到这种情况:一个人在A公司做的是企划工作,到了B公司却做设计工作,这就是组织结构的差异性。

 

第二点是业务流程缺失,这个行业有很多反共识的地方。服装行业是一个金字塔的结构,大家提到服装行业,天然会想到安踏、李宁这些知名品牌;提到加工厂,可能会想到申洲国际,但要知道,这些企业在中国服装产业里占比不到1%,剩下99%的服装企业都是中小规模或小作坊。公开可查的中国服装相关企业一共有17万家,但其中组织结构完善、有数字化基础的,不管是品牌类还是生产类,都凤毛麟角。绝大部分服装企业唯一的数字化系统就是微信。

 

虎嗅:SaaS并没有解决根本问题,那么AI能解决吗?或者AI能让服装行业直接跳过SaaS进入AI时代吗?

 

周栋:我认为会。我们现在笃定的一件事就是我们在服装行业做AI就是以某种形式直接跳过“数字化和信息化”。但最本质的差异在于,上一个时代的SaaS和AI时代要解决的问题完全不同。前者本质是想把企业的线下业务流程线上SOP化,但这个前提是,企业线下得先有完整的业务流程、有SOP才行。但遗憾的是传统服装行业是感性主导驱动的,它们流程混乱、标准不一,难以联动。

 

上一代SaaS失败根本不是工具好不好用的问题,而是没意识到:以服装行业为例,人和组织才是这个行业最大的非标变量。没先解决这个问题,工具做得再好也没用。

 

到了AI时代,但出发点和SaaS完全不同。我本质上不是想做一个标准化工具,帮企业把线下流程线上SOP化,而是带着AI这个全新的生产力,帮他们重构新的业务流程,从而让企业内部人员可以利用AI实现增收或完成以前完成不了的任务。对他们来说,这是新的生产力,看待业务的视角完全不一样了。

 

虎嗅:这个AI带来的生产力怎么落地到业务上,举个例子?

 

周栋:就以这件衣服为例,面料商手里只有面料,他们会找到客户后上门,拿一块面料给对方看,说自己的面料多好,再给一些色卡,说能做多少种颜色,用这种方式推销。这个过程里他能传递给下游的信息总量很有限。

 

用上AI之后,AI可以先为这块面料生成适配不同服装品类的款式设计;下一步还能基于这块面料设计出一整套企划提案,甚至还能生成模特图。然后面料商就可以带着这些AI创造的新信息增量,去跟客户沟通。

 

这里最关键的变化是,客户获得的信息总量完全不一样,客户能直接看到这块面料最终做成衣服和配上模特后的效果,这能给面料商创造新的增益。

 

从零开始搭建服装行业专属数据

 

虎嗅:这里面有大量非标数据,你们怎么解决数据工程?


周栋:服装产业的数据都沉淀在人的大脑里,而不是数据库。他们可能连信息化系统都没有,是个数据荒漠;第三是客观相对的来看,这个行业整体从业人员素质偏低,这自然会导致两个结果,学习意愿低,使用新工具的成本比其他行业高得多。所以我们做AI,也绕不开这三个问题,从做AI的第一天起,就要思考怎么解决。

 

我们分不同阶段解决数据从哪来、用什么行业Knowhow进行处理、不够的高质量配对数据如何解决。我们会通过公开信源合理抓取,外加产业伙伴定向收集,不乏下厂把纸质的衣服版单收集回来再做结构化处理;我们会有自己多年积累的产业知识库做标注和关联重构。不够的高质量配对数据,我们自己拍,或者通过数据合成的方式补齐。

 

目前总数据量规模已经做到2亿原始图像数据以上。

 

虎嗅:数据工程搭建好之后,你做了什么事?

 

周栋:有了数据之后,我们做了第二件事就是训练服装行业的专项模型。我们是全球第一家做出服装行业各类专项模型的公司。

 

例如我们在2023年就训练了自己的多视角模型,比如让AI生成一件衣服各个角度的模特上身图,当时通用大模型也能做到,但大多只能出正面图。在服装行业的实际需求里,需要360度多视角展示,得看侧面、背面的效果,更难的是要保持各视角的一致性,否则就没有可用性。我们内部把这部分工作定义为“产业模型工程”,也就是数据工程加产业模型工程。

 

第二件事是从2022年底到2023年,也就是各类通用LLM、VLM大模型出来之后启动的,我们称之为基于通用模型的“持续预训练架构和自动评估体系”。我们很清楚自己没有资本去做基础大模型,我们的核心是产业模型,规模相对较小。但通用大模型出来了,并且迭代速度很快,肯定要借助它的能力。

 

虎嗅:那你怎么确保大模型未来就不会做这件事?万一哪一天大模型效果越来越好,生成图像越来越对了怎么办?


周栋:大模型一直在迭代,生成的图片会越来越好看,但解决不了“越来越对”的问题。比如它生成服装款式或模特图时,可能会丢失面料质感、出错工艺细节,这对B端客户来说是无法接受的,相当于产品变了,完全不可用。

 

虎嗅:有没有一个节点,能明显感觉到模型效果突然变好了?

 

周栋:第一个阶段是2024年,因为我们借了早期通用开源大模型的东风,结合我们的领域算法和数据工程,构建出了属于我们自己的服装产业垂直大模型,再加上我们的产业专项模型,当时就明显感觉到我们的AI能力整体上了一个台阶。

 

第二个阶段是今年。VLM和多模态领域都有更多特定性能更好的开源模型,发展也更迅猛,我们就做了模型迁移。我想表达的是,对我们来说这件事不复杂,因为我们背后有一套成熟的技术架构和自己的benchmark评估体系,只要市面上出现更好的开源大模型,我们就能以最快速度判断和迁移,把我们的AI能力再往上拔高一个层次。

 

先在日本市场找到MVP,再进入中国市场

 

虎嗅:商业模式是怎么设计的?因为最早你们是产业互联网的思维,当时的收费模式可能跟现在不太一样?

 

周栋:我们从一开始就规划了三个商业阶段。

 

第一个阶段先做了SaaS,有两个客观原因。第一,我们当时的综合技术还没牛到能直接做AI Agent或者更符合愿景的产品;第二,我觉得得先有一个MVP,先初步验证PMF,投向市场看一看,找到一个入口和方法,获取行业内真实客户的使用反馈和know-how反馈。所以我们做了SaaS,然后确定了切入的市场。

 

虎嗅:切入哪个市场?

 

周栋:日本市场。相比于欧美和中国市场,日本市场的竞争没那么激烈;第二,日本的服装企业非常规范,数据质量相对更高;第三,我们当时看到了日本的国家政策,能明显感觉到日本不想错过这一波AI浪潮,虽然它赶不上中美,但当时日本政府对日本企业有一些补贴政策。我们在日本认识一家做服装贸易的日企商社,直接选择它做我们的代理商。这样一来,我们有好的AI产品,切入了市场空白,又找了日本本土有服装资源的企业做信任背书帮我们销售,天时地利人和。

 

今天日本所有能叫得出名字的服装大企业,几乎全是我们的客户,其中一家最大的零售品牌客户总部相关负责人到我们公司,他们说,已经调研了全球几十家AI公司,最后选择了我们。

日本电视台对向量螺旋的报道

 

虎嗅:日本市场验证成功之后,接着你们怎么做?

 

周栋:我们其实是同步启动了第二个市场,中国市场,我们先确定了生产型企业切入,确定两个趋势作为切入方向:第一个是“二代接班潮”,第二个是“供应链出海潮”。

 

国内市场的客户对我们来说更宝贵的一点是,国内业务场景和需求标准更复杂,他们的上下游会不断提出各种苛刻的新要求,因为国内的产业链更完整。我们在中国市场的策略是“不求量大,但求做细做深”。现在我们有底气说,在国内规模以上的服装生产型集团客户中,我们的市占率绝对是第一的。

 

虎嗅:什么时候在国内跑通了第一个标杆客户?

 

周栋:申洲国际。让他们认可我们并签约大概两个月。

 

虎嗅:你们是直接跟老板谈,还是跟业务部门谈?

 

周栋:大多都是直接跟老板或者有决策权的负责人谈。

 

虎嗅:申洲国际已经是服装行业里数字化程度很高的公司,为什么还要购买你们的AI服务?


周栋:他们的数字化确实非常完善,服装行业除了3D软件,还有CAD打版软件、印花分色软件等等各式各样不同环节的软件系统…… 申洲的数字化系统非常丰富和完备,但仍然无法解决内部数据的流通,以及直接交付结果这件事。

 

我们尝试帮他们做的第一件事是在不丢失已有数据系统的基础上,打通散乱数据资产的可复用性和可利用性,另外就是循序渐进帮他们做AI Agent,例如用他们已经积累的面料、材料和工艺的能力,直接生成一套企划方案给到品牌方,为他们直接创造更多服务生产力的增量。

 

从技术中台到数字工种


虎嗅:第一阶段的商业模式还是SaaS的形式,第二阶段和第三阶段的商业模式会有什么迭代?

周栋:2025年已经打造了一个新的产品,我们把它叫做“技术中台”,当客户不满足于标准化、产生个性化需求时,就可以用技术中台,把所有非标需求转化为技术层面的标准化组件,从而更快地实现交付和履约。另一方面,也可以把技术中台开放给客户,如果客户自己有IT团队和产研团队,他们可以自己在上面搭。

 

第三个阶段的商业产品,现在已经在做demo了,我们叫“数字工种”。不管是SaaS还是企业级Agent,最终都是客户员工在使用工具,这仍然没有完全打破我刚才说的那个魔咒,还是AI配合人,且决策人本人通常对AI的实际效益价值是没有直接体感的。

 

我们想解决的核心问题是:既然前者都是AI配合人,人是关键变量,那我能不能倒过来,让AI主动完成工作,人来配合AI?决策人考核“它”的方式,跟考核“人”是完全一致的。

 

这背后的逻辑是,上一个时代的工具类产品,抢占的是每家To B企业的IT预算,而企业的IT预算可能只占总预算的3%、5%。但我们想换个方式,我们提供数字劳动力,要抢占的是企业的人力预算。

 

我们换了个视角来打开更大的赛道,我抢占的不是全球服装企业的IT预算,而是全球服装企业的人力预算。

 

虎嗅:你们先做了什么岗位的数字员工?


周栋:在服装产业图谱里,会有不同的数字员工解决不同环节的问题。这些所需的know-how,就来自我们做SaaS、做大客户项目过程中持续积累的know-how,再把这些know-how抽象成不同的数字员工,对应解决不同的行业问题。比如我们的第一个数字员工,名字叫“电商内容专员”。

 

虎嗅:为什么先选择做“电商内容专员”这个数字员工?

 

周栋:因为它离钱最近。

 

虎嗅:现在的营收情况方便透露吗?

 

周栋:商业化第一年只做了半年,营收大概大几百万人民币;后面是每年实现三倍增长。


虎嗅:三倍增长目标是基于什么判断的?是不是因为明年你们要推出那个技术中台?

 

周栋:主要基于三个方面。第一,因为我们的技术和产品能力会越来越强,自然能获得更多客户的认可;第二是区域扩展,除了日本和中国,我们已经开始拓展美国、法国、德国这些欧洲市场;第三就是新的项目形态的增量。

 

现在营收的绝对值不是最重要的,更应该关注每年的增长是否是稳步上升的状态。





文章标题:靠扒“脏”数据,这家公司干到估值数亿

文章链接:https://www.huxiu.com/article/4827386.html

阅读原文:靠扒“脏”数据,这家公司干到估值数亿_虎嗅网
AI创投日报频道: 前沿科技
本内容未经允许不得转载。授权事宜请联系 hezuo@huxiu.com。
正在改变与想要改变世界的人,都在虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定