2018-12-20 14:05

导航中的林志玲语音,真的是一条条录出来的吗?

本文来自微信公众号:KnowingAI知智(ID:Knowing_AI),作者:虞喵喵。


如果不是录出来的,听起来很自然的导航语音,又是如何完成的?点击视频,你对人工智能的了解就能轻松超过全世界 99% 的人类!


图文版本送给不方便打开的朋友:



语音导航我们都用过,不过温柔的林志玲姐姐语音,究竟是录好的?还是合成的?



在开始合成语音之前,需要先录制一些语音作为语音库。为了尽可能的覆盖语言中的元音、辅音、音调,录制的内容通常需要一定的设计。



合成语音的第一步,是预测文本的读音。除了将文本转换音素序列,为了让生成的声音更加自然,我们还要分析文本的节奏、重音,处理文本中的数字、缩写等等。



接下来,合成声音。一种方法是从语音库中逐一寻找与目标一致的音素,并将它们拼接起来;另一种方法则是将第一步预测的音素转换成每时每刻的语音参数,加上从语音库中学习到的特征,再生成语音。



除了这两种方法,人们还在尝试使用深度学习端到端的完成语音合成任务。不过从结果上看,还是将前两种方法融合起来效果比较好。


在语音导航中,左转、减速、掉头等较短的语句,通常是录好的内容。


关键信息总是在变换的长句子,当然是合成的啦!

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定