本文来自微信公众号: 白鲸出海 ,作者:白鲸小编,编辑:殷观晓,原文标题:《一年从0到300万美元ARR,非典型AI创业者斩获千万融资|对话创始人》
今天,ListenHub官宣完成200万美元天使+轮融资。
8月份,在选题中,我们观察过ListenHub,但当时分析下来,AI播客很难跟真人播客竞争,虽然入局者众多、资本也愿意押注,但能跑出来的产品几乎没有。而ListenHub的思路与其他产品很不一样,并不是给c端消费的,是给Pro用户的创作工具。
AI音频创业,除了Suno、Speechify、Elevenlabs等最早入局,并占据各自细分方向头部位置、拿下用户心智的产品,甚少有亮眼的产品跑出。如之前我们看到的无论大厂、还是明星创业者,做的音频产品都无甚水花。(可参阅选题《前百川联创下场、字节腾讯入局,「AI小宇宙」正在被集体押注?》)。
而4个月过去,ListenHub却声量颇大,不仅陆续更新了FlowSpeech(书面语转口语语音)、解说视频、PPT等多个新功能。而且,2026年1月1日,ListenHub宣布完成一笔200万美元“天使+轮”融资,由天际资本领投,小米联合创始人王川跟投。根据创始人橘子的说法,ListenHub的年经常性收入(ARR)已经突破300万美元,并达到了月度盈亏平衡。
但是,细看ListenHub的核心功能,无论是AI播客,还是后续扩展的FlowSpeech、解说视频、PPT等功能,都并不算独特,无论是通用AI产品、还是音频赛道的其他产品都有所覆盖,技术上也并不存在什么壁垒。
ListenHub背后的创始人橘子老师,也是一个“非典型AI创业者”。刻板印象中AI创业者都是大厂出身或者“技术大牛”。而橘子老师口中的自己,是全校第一的高中理科生,却在大学的时候转向语言学科,研究起了表达的艺术。而在创业者之前,橘子老师最为人所知的身份是一个“AI媒体博主”,全网粉丝超过20万。
这一次通过与橘子老师的深入交流,让我们得以一窥“站在技术与人文交叉口”的ListenHub,如何看似平平无奇,却能够在惨烈竞争中杀出重围。
AI语音产品要始终站
在“技术与人文的交叉口”
白鲸出海:此前您在MiniMax工作过一年多时间,完整经历了AI发展最快的时间段,去年年末又开始创业,您为何会决定创业?又为何选择了音频方向?
橘子:我们在Hailuo AI里面其实做过很多尝试,比如语音电话、声音克隆等,在这个过程中会发现AI语音是非常重要的一种模态,比文字模态更贴近用户最自然的状态,用户在打字交流的时候很难描述自己想法,但却能靠语音跟AI聊得很好。
我认为,随着技术技术越好,人的交互应该是越来越简单,回到人们最初交流的样子,也就是语音,所以到了2024年底,看到大量团队投身于语音底层模型的研发,这不仅印证了趋势,也坚定了我们在音频赛道探索的信心,从而开启了这段创业旅程。
白鲸出海:从我们的观察与您之前的一些分享看,ListenHub是坚定走创作者工具路径的,而没有像其他AI音频创业产品一样把内容分发作为重点。然后,在AI生成播客之外,又陆续更新了FlowSpeech(书面语转口语语音)、解说视频、PPT等细分功能,您为何会坚定选择创作者工具?又如何选择这些细分功能?
橘子:公司成立时我们的定位就是要做语音交互,而交互是由“输入”和“输出”两部分组成。我们观察到,播客场景中,用户去交互的欲望其实不大,比如NotebookLM的AI播客是允许用户与AI对话的,但是无论是我还是我调查的其他用户,其实很少人会使用这个功能,在使用过程中,用户只想听,基于这个观察,我们今年决定还是以“输出”为主。
而要做到高质量的‘输出’,单纯靠AI生成往往缺乏灵魂。我们需要技术与人的结合——技术负责效率,内容质量则需要人的审美来把控。我们意识到,只有赋能那些对内容有追求的创作者,让他们用好AI,才能最终产出用户真正爱听的内容。所以ListenHub自然就选择了和‘创作者’站在一起,做他们的提效工具。在未来,我们会持续拓展功能,覆盖更多高价值的语音场景,慢慢将ListenHub打造成一个综合音频创作生产力平台,它不仅可以帮用户去做播客,还可以变成口播内容、甚至是带语音讲解的PPT、带画面的讲解视频,这其实都是很自然的过程。
白鲸出海:但get到这个自然的过程,其实需要对创作流程有深入的了解。您本人作为创作者的经历是不是有很大的帮助?另外您之前在其他场合说过,语音公司其实处于“技术与人文的十字路口”,能展开讲讲吗?在建立团队时会看重成员们的人文素养吗?
橘子:我高中的时候其实是理科生,而且是全校第一的理科生,但我在大学的时候就会觉得说我只是懂数理化,但没有办法做出一个很好的产品,所以大学就主动选择了语言方面的专业,我会觉得语言是非常本质的一个东西。对于一个产品来说,就算功能一样,它的讲述方式不一样,也会有非常不同的效果,所以语言是核心点。后来我做的事情,无论是做营销、自媒体、还是创业之后和用户交流,也全部建立在语言的基础上。
在公司中我也会去寻找一些懂内容的人,能将如何做内容的一些Know How融入到我们的产品中,而不是纯以技术为导向。而我们公司的组织文化,也很重视大家的“Work Life Balance”,鼓励大家有自己的生活、有自己的爱好,比如我们团队15个人中有4个都是二次元,运营和内容团队的同事也是对生活非常有热情,会尝试各种各样的东西的人,我觉得这样的团队能给产品带来活力。
创业公司不该考虑壁垒,
快才是真正的壁垒
白鲸出海:从ListenHub的产品迭代时间线看,是从AI播客起手,再到口播、视频,进行横向的扩展,您怎么确保新功能能够匹配用户的需求?
橘子:播客的本质是把“文字转化成通俗易懂的语音”,降低内容消化的门槛,其实后面做的口播、视频也是一样,只要内容消费门槛足够低,就会有传播、有流量,这是大方向。
而聚焦目前,我觉得最重要的是“跟用户做朋友”,因为我本身做自媒体,就是一个创作者,所以起初是我需要这个东西,然后我们会去确认,用户是否也需要这个东西,而“北极星指标”就是用户是否付费,在推出新功能之后,我们会发到用户群里,去观察他们的行为,如果付费还可以,那这个功能就值得做。
实操层面,则需要快速迭代、快速验证用户需求。其实在技术层面,快速迭代现在已经很容易做到了,AI Coding工具的能力已经很强了,可以大大缩短开发的时间,比如前段时间Nano Banana 2(Pro)发布时,我们一位工程师仅用了5分钟,就让产品适配了新模型。
而与技术适配,我们在组织架构上也进行了“AI Native”改造。这方面,我们探索出了一种“端到端全栈工程师(End-to-End Full Stack)模式“,工程师们不仅是要开发前后端,更是要把产品设计、开发测试、最终决策一肩挑。我们的组织像是个灵活的“任务酒馆”,不用通过层层审批,只要有想法,一个人就是一个军团。
而快速验证则正好是我们的强项,因为我全网有20万粉丝,可以快速拉群,找到用户来进行体验,得到反馈。“人有冗余,一人成军,开发、验证快”这个循环才能真正转起来,我们现在产品的迭代就是以“天”为单位的。
白鲸出海:您觉得对AI产品来说,快速上线、快速落地、快速验证,是切入市场的关键?
橘子:没有人能保证创业idea能成功,所以肯定需要多次尝试,一年尝试2次和一年尝试100次,成功率肯定不一样。我觉得在大方向没错的前提下,所有可能性都应该尝试一遍,特别是今天AI Coding能力这么强,迭代速度不成问题的情况下。
而另一方面,已经成为既定事实的是,AI产品切入市场的时间与宣发都与模型的发布密不可分,比如Manus对应的Claude 3.7的发布,Cursor对应Claude 3.5、Lovart对应GPT-Image-1等等。
应用公司离不开模型,但如果模型发布之后,应用公司没有能在第一天做出一些小尝试去吸引用户的话,就很难获得流量红利。比如,11月20日Nano Banana Pro时,全球社群好像没有第一时间关注到这个更新,但我们捕捉到了“静默的红利期”,花了5分钟的时间完成了适配,成了世界上第一个上线该模型的网站,所有的KOL、流量都只能汇聚到我们这里,我们就吃到了这个流量,没花一分钱就获取了20万用户。
白鲸出海:很多创作者都更喜欢all in one,您其实在产品迭代时也在横向扩展,甚至通过独立产品的形式上了AI生图、AI音乐等等功能,您觉得大公司、创业公司,都在做All in One,ListenHub的壁垒在哪里?您怎么看您跟大厂产品之间的关系?
橘子:我觉得大家喜欢all in one没有问题,一个场景中间用到的所有工具都应该提供,但不同工具箱所服务的群体是不同的。我们服务的是以前没有创作能力,但是很有表达欲的人群,其实这是创作者增量的部分。而且,在实践中会发现,如果把工具的使用难度降低一个等级,就能获得10倍的用户增量,而且我们和用户交流时会发现,用户对AI的使用习惯,和AI圈子里的认知很不一样,综合下来,我们会把差异点定位到easy-to-use。
而在壁垒这个问题上,我认为创业公司与大公司的角度是不同的,大公司的壁垒其实是提供给巴菲特来选股的,他要从1万家公司里选出20个来投资,当然看重护城河。但创业公司需要在别人的护城河里找到突破点,这个过程没有护城河,Timing is everything。5月19日ListenHub刚发布,第二天豆包就发了AI播客的预告,其实我们领先大厂的时间差只有1天,但这1天就是生死线。
商业的本质其实就是用最少的资源得到最多的用户,嗅觉、迭代速度、增长速度才是真正的护城河。
白鲸出海:上面我们谈了很多“形而上”的话题,那么在实操层面,ListenHub是如何在早期预算有限的情况下,完成冷启动的?
橘子:那时候是被逼出来的“全员营销”,因为没钱投流,其实就靠“人肉”,我把所有做自媒体积累起来的私域资源—X、公众号、视频号、即刻,甚至是一个个微信群、各种KOL的联系方式,全部用上了,虽然没花一分钱,但那次宣发的总曝光超过了百万。
而且,我们敢于发布“不完美的产品”。ListenHub刚上线时完成度可能只有30%,甚至没有付费系统,但对于AI产品来说,“在场”比“完美”更重要,虽然初期流失率高,但通过这半年的打磨,我们现在的用户流失率相比最初已经下降了10倍。
白鲸出海:回顾创业这一年,您有什么收获吗?
橘子:最大的变化是对“速度”的理解。年初为了融资,我们走了4个月的流程,而AI的热点周期只有2周。“AI的世界很快,但创投的世界太慢”,这种错位会拖死创业公司,所以我们后来的策略是:不要盯着VC的钱,要盯着用户的钱。
“没有环境”是所有通用AI
产品都没有解决的交互难题
白鲸出海:在ListenHub之外,您还做了不少独立的站点,比如刚才谈到过的AI生图、还有AI音乐等等,您怎么看这些产品和ListenHub的关系?
橘子:我认为这些事情就是在搭积木,未来要做交互的话,其实音乐、图像等模态的内容都不可或缺。所以,我们会通过这种方式验证不同模态的内容,而操作方法就是先去做一个很小的产品,如果产品能闭环、用户肯付费,我们就会把它吸收进ListenHub,比如AI音乐功能1月份就会在ListenHub中上线。
通过这些能力的慢慢扩展,其实ListenHub也会扩展用户群体,比如明年可能会服务更多的学生人群或者教育工作者,AI有个本质叫“Context Remix”,ListenHub就要把这一点发挥到极致。
白鲸出海:ListenHub从音频切入,现在又开始涉足PPT讲解、解说视频,这是否意味着你们要换赛道?视频功能的用户付费意愿真的强吗?
橘子:ListenHub的初心是让大家能够听见好奇心。因为好奇心是人类作为创造者最重要的特性,音频是我们的强项,但并不会因此就给自己设限在纯音频领域。就像音频播客的发展趋势是视频播客一样,我们的产品也从纯音频发展成为视频,从听见到看见,既是行业发展,也是人类真实的需求。
所以在付费层面,我们并不担心。之前我给某知名媒体人演示我们的新功能:把他的播客直接配上AI插图和PPT转成视频。我问他:“如果把你的播客变成视频,成本600块钱一个,你愿意付费吗?”他当时毫不犹豫地说:“给我先来5个!”
这背后的原因也很简单,视频的传播范围确实是远远超过音频的。
白鲸出海:理解下来,无论是播客、FlowSpeech,还是AI音乐、生图、后续的视频,都是一个阶梯,用它们来打磨自己的技术,去了解创创作者真正需要什么,为最终做交互来做准备,这样理解对吗?具体来看,您对ListenHub的未来愿景是什么?
橘子:从技术角度是这样的,但真正难的其实是环境,就是怎么让用户能够打开产品,他就知道要做什么,我们打开一个通用产品,发现它好像什么都可以做,但又不知道哪些任务能做好。张小龙在《微信背后的产品观》中写道“人是环境的反应器”,但今天所有通用产品都没有构建好这个环境。
未来的话,我们会从内容输出、慢慢扩展到输入,让AI去和用户交流,从中获得他的记忆和其他信息,并以此为基础去控制用户的设备,还可以给他提供各种基于语音的内容,其实扩展空间还是非常大的。
我们很多时候聊语音,就单纯地把它理解成语音,但是语音其实包含了文本、加上画面就是视频,是语言的核心叙事逻辑,所以语音公司更需要把所有AI能力都拿来用,才能做好这件事情。我觉得,这三年的AI从来没有让我们失望过,每一年都会有非常惊喜的东西,技术肯定会越来越好,但更重要的是环境,大家更需要的不是多复杂、而是多么简单,本质还是“做最简单的工具”,这种环境的构建,也回到了我们的定位easy-to-use,我们在12月份计划重构我们的网站,把它设计成用户能理解的简单形态,未来我们也会持续在这方面优化。
白鲸出海:语音其实是一个偏陪伴性质的媒介,所以其实在您的愿景当中它并不只是一个“工具人”帮用户提效,还需要有一些“人文温度”,从这个角度,您怎么看做交互这个愿景?
橘子:要做到“人文温度”,一定是既要技术好,又要能够去了解人的心理,构建长期关系。而这种关系肯定是通过长期的交互、且AI逐渐越来越懂用户,然后才能将情绪情感上的东西交付给用户,其实这是很自然发生的一个事情,不是玩一场游戏、角色扮演那种浅层的陪伴。
在技术层面,只要把足够的信息输入给AI,它理解力应该是超越了大部分人类的,现在有时候人们会觉得AI理解情感弱,其实是缺乏相关的信息,所以我们最近尝试做了一个“面试教练”,用户可以和AI去锻炼面试流程,AI会实时给出反馈,比如语速、语气,还有一些表达方式等等,聊完之后还会把这些聊内容记下来,了解用户的过往经历,未来可以给用户提出一些个性化的建议和启发,我觉得这是我们探索交互的一个很好的起点。
