本文来自微信公众号: 白鲸出海 ,编辑:殷观晓,作者:白鲸小编
回顾2025年我们⼀直在追踪的几个类别,语言学习是很有意思的⼀个分类,产品找到了最多的差异化定位,远不止Speak独美。
相较于Speak让用户张口、Duolingo用游戏化让背单词不再那么反人性,今天盘点的我们在2025年至今发现的AI语言学习产品不针对于泛用户,而是针对于移民、LEP人群、跨性别群体。但这些产品的流水成绩,反而体现出,越小众、越刚需,而这种小众其实也仅是相对于学习一门语言这种大众需求而言,事实上,有共同痛点(如发音不准、针对于特定场景词汇匮乏)的人群规模往往不小。
通过解决“口音影响面试”、“看病时词穷”、“声音不自信”这些具体问题,这些新冒出来的AI语言App几乎“人均千万美元ARR”。

一、从“中式英语”到“职场自信”:
BoldVoice的口音生意
目标人群:美国大几千万的移民,以及留学生、国际职场人士
在硅谷,有个段子:印度工程师升职比中国工程师快,不是技术更强,是开会时“敢说”,即便他们的口语也一股“咖喱味”。虽然其中有不同民族的性格差异,但本质问题依然是非英语母语者的焦虑学了10年英语,语法词汇没问题,但一开口就是有点怯。
由同样为移身份、有相同困扰的Anada Lakra(CEO)&llya Usorov(CTO)创立的BoldVoice,抓住的就是这个痛点,定位“口腔健身房”,专注口音矫正。
AI怎么做的?

BoldVoice结合了真人演示和AI纠音两大教学模式。
用户先录制自己的语音,借助AI评分找出改进之处;
再观看好莱坞口音教练的视频演示,观察、模仿地道
的发音方法。除了设计了专门的发音课程之外,在自由
对话版块,会将对话目标精确设定到使用特定单词等。
BoldVoice采用了真人+AI、课程+自由对话的组合,并且将所有目标收敛到“发音矫正”,抛弃了任何与词汇量和语法相关的训练。这样的专注设计,借助于引发病毒式传播的TikTok英语口音测试,帮助BoldVoice从之前的ARR百万美元快速进步为月入百万美元。

BoldVoice高峰期收入|图片来源:SensorTower
不过,2025年年底,其月流水已经回落到33万美元(SensorTower数据)。但即便如此,BoldVoice还是凭借2025年年初的爆发式增长,吸引了资本关注。在2026年1月,宣布完成了2100万美元A轮融资,1000万美元ARR、500万用户的数据。
值得创业者关注的是,BoldVoice,可以服务的可能不止美国几千万的non-native speaker,全球总计有15亿english speaker(甚至未来可能会增长值20亿),但其中70-75%的人的母语都不是英语,也就是超过10亿。显然,这其中蕴藏了巨大的口音纠正需求(来源:全球语言数据库Ethnologue数据)。

2026年年初,BoldVoice团队官宣融资

二、不教日常对话,只练"关键时刻":
Learna的场景化突围
目标人群:美国2890万LEP人群(Limited English Proficiency,英语能力受限者)
如果说,BoldVoice的人群是美国移民群体,其实Learna的底色也一样。但虽然大盘一样,但是他们针对的依然是不同的细分人群、不同的需求。BoldVoice做的是口音矫正、锚定人群会说但不敢说,而Learna针对的问题更基础,不是羞于开口,而是因为不知道说什么、开不了口。
这个产品的用户画像是移民人群中接近3000万的LEP人群。他们能用英语点餐、问路,但一到看病、面试、租房这些复杂一些的场景就卡壳。
对应,Learna所提供服务为“应急式学习”。它把学习场景拆成13个主题:医院、法庭、银行、面试......每个场景都有AI扮演的角色前台、医生、面试官,和用户实时对话。

Learna里面的角色扮演标签页
AI怎么做的?

通过交流-纠错-改进的快速迭代循环,快速提升用户应对某一场景的口语能力。以场景即课程、AI对话即学习的产品设计理念,迎合用户无压力实现快速学习成果的期望。
用户不是为了“学英语”付费,而是为了“下周面试能顺利”付费。对应的,6.99美元的周订阅作为收入主导,匹配“应急学习”的短期需求。
需求很刚、但也很短暂,Learna也因此拿下了260万美元月流水、美国教育畅销榜第2的好成绩,但周订阅主导的结构导致其不断需要获取新用户,弊端为较高的获客成本。
三、从999美元到19.9美元
的声音革命:VocalImage
目标人群:职场人士、跨性别群体、声音自卑者
这款产品,同样是一款针对于口语的产品,但是它不像Learna教你在某些场景下该说什么,也不是Boldvoice改善你不地道的口音,教的是“通过发音方式和沟通技巧的练习,让用户说话更好听、更动听”,属于更进阶的需求。
在传统模式下,这种进阶需求的目标人群是演员、歌手、政客、企业高管这样的独特人群,而服务于这类需求的则是传统的声音教练,提供服务标价999-2999美元的课程。
但事实是,表达不清、说话不够动人好听,这类需求从来不仅限于上述人群,更多的普通人也有此类困扰,YouTube上声音教练博主动辄千万级、百万级的粉丝量即是证明。但因为供给价格高昂,导致这类需求一直被压抑。
从白俄罗斯移到爱沙尼亚、有着同样困扰的创始人Nick Lahoika,利用AI让这件事变得平化,做出了Vocal Image,将可获得服务的人群拓展至大众人群,还从中挖掘出了跨性别群体的需求,服务于特定人群的自我认同与表达。
产品设计与AI的融入


VocalImage每日训练页面
借助于声音与魅力/性别的关联,以及“测试声音类型”的趣味测试,Vocal Image获取用户并以19.99美元/月的“平替方案”实现1200万美元的ARR。
四、专业人士的“词汇健身房”:
Vocabulary的精准狙击
目标人群:GRE、GMAT备考生,专业领域学习者
不同于以上3个产品,针对于开口难的问题,Vocabulary回归了英语词汇的学习。当然,面对这个“古早需求”,Vocabulary这个后来者也刁钻地找到了自己的受众。
GRE词汇有多难?即使英语母语者,掌握率也只有15-20%。Vocabulary的目标受众除了这类考试的考生,还有在美国社会高度依赖于“表达”的大背景下对某一个领域的高阶词汇有学习和表达需求的专业人士。
Vocabulary没有走“背单词游戏化”的老路,而是针对于这类人群做了三件事:
1、提供丰富的主题选择:由用户自主选择想要学习哪一领域的单词;
2、推荐系统优化扩展单词表:同时根据用户的选择、想学习单词的收藏和点赞等行为,进行推荐系统的优化,扩展单词列表供用户进一步选择;
3、克制的产品设计:针对于高阶用户的高自觉特性,交出选择权的同时,也保持克制的callback、游戏化设计。

而在上述核心设计的同时,采用沉浸式的学习模式,页面简单(重构词典页面)+宁静背景图,用户以类似于刷短视频的方式上下滑动学习单词。
增长上,团队直接以“单词页面+好看的背景+舒缓音乐”作为素材展示给用户,并在配文当中突出“Everyday”和“Expend Vocabulary”,整体透露出每天惬意中实现提升、宁静以致远的感觉,实现高展示量(展示20w+)。简单直接吸引目标受众实现高转化,在今年1月,登上美国总榜,同时在教育分类收入榜单的日榜上最高爬至第2位,仅次于多邻国,日流水高位10万美元,实现用户与收入双收。

这四款产品看起来毫不相关,但复盘后会发现,它们都踩中了同样的点:
1.人群定位:从小众切入,但市场足够大
移民、备考生、跨性别群体,单独看都是“小众”,但加起来却至少是千万人的规模市场。
2.痛点聚焦:不解决“学语言”,解决具体场景
小众背后又是刚需他们买的不是“学习”,是“解决问题”。
BoldVoice不教英语,教的是“消除口音焦虑”;Learna不教对话,教的是“面试时不卡壳”。痛点越具体,付费转化越高。
3.商业化:强付费意愿
刚需带来的强付费意愿。对比一些泛学习产品,Vocal lmage敢收19.99美元/月,因为用户买的是“职场自信”、“性别认同”;Vocabulary,虽然价低,但实质上仅做重构单词页面+推荐,用户嫌弃纯工具属性还要收费,但依然口嫌体直。
数据来自SimilarWeb、点点数据、Semrush、广大大等三方平台,可能与真实数据中存在一定误差,仅供参考。
