【阿里达摩院发布了新一代AI语音FPGA芯片技术,效率提高100倍以上】
8月21日,在美国旧金山举行的芯片行业顶级学术会议HOTCHIPS上,阿里巴巴达摩院发布了新一代AI语音FPGA芯片技术:Ouroboros。
阿里达摩院称,这是业界首款专用于语音合成算法的 AI FPGA芯片结构设计,该技术能将语音生成算法的计算效率提高100倍以上。Ouroboros 的设计可以实时运行 WaveNet 等文字转语音(TTS,Text-to-Speech)算法 ,实现实时语音合成。
负责现场技术讲解的阿里达摩院科学家表示,Ouroboros的突破在于它使用了端上定制硬件加速技术,替代云端服务器,有效避免了对网络连接和云端服务的强依赖性,解决了这一问题。以计算量最大的AI语音合成算法WaveNet为例,为了生成1秒的语音,CPU和GPU需要消耗50秒的计算时间,但Ouroboros在FPGA环境下只需要 0.3秒,大大提升计算效率,同时将整体服务成本降低 10 倍以上。
阿里发布的 Ouroboros 技术,同样适用于达摩院于今年 7 月发布的新一代的语音合成算法KAN-TTS。
阿里达摩院还宣称,Ouroboros 芯片技术除了语音合成之外,还将支持AI语音识别。基于 Ouroboros 研发的语音AI芯片,有望率先用于天猫精灵。