AI辅助发音:没有声带,人也能说话了
2024-03-13 08:11

AI辅助发音:没有声带,人也能说话了

本文来自微信公众号:学术头条 (ID:SciTouTiao),作者:学术头条,原文标题:《刚刚,新型AI辅助发音系统登上Nature子刊,没有声带,人也能说话了》,题图来自:视觉中国

文章摘要
加州大学洛杉矶分校的研究团队开发出一种基于机器学习的柔性贴片助听装置,可以帮助没有声带的患者产生语音信号,实现有效沟通。该装置利用磁弹性材料,具有轻巧、可穿戴和自供电的特点。

• 💡 新型柔性贴片助听装置利用机器学习将喉部肌肉运动转化为语音信号;

• 💡 助听装置采用磁弹性材料,重量轻、可拉伸性高、信噪比高,舒适且可穿戴;

• 💡 该装置通过肌肉运动识别语义信息并选择相应的语音信号进行输出,准确率可达95%。

在人工智能(AI)的帮助下,一种新型柔性贴片,有望帮助部分嗓音障碍患者实现有效沟通。


加州大学洛杉矶分校生物工程系助理教授陈俊及其团队,开发了一种可以在机器学习辅助下将喉部肌肉运动转化为语音的“柔性贴片”助听装置


该装置基于磁弹性效应,使有声带障碍的患者能够通过肌肉运动来产生语音信号,从而辅助其言语功能。


具体来说,这种助听装置首先收集患者喉部肌肉运动的数据,然后借助机器学习算法对这些信号进行分析和分类,最后识别语义信息并选择相应的语音信号进行输出。


图|附在喉咙上的可穿戴柔性贴片示意图。


据介绍,这种助听装置采用了磁弹性材料,具有重量轻、可拉伸性高、信噪比高等特点,保证了设备的舒适性和可穿戴性。另外,这一助听装置也已经实现了自供电。


研究团队对 8 名没有嗓音障碍的受试者进行了测试,他们被要求在站立、行走和跑步时说出和小声说出一些单词和词组,如“Merry Christmas”或“I love you”。结果显示,该助听装置的准确率可达到 95%。


相关研究论文以“Speaking without vocal folds using a machine-learning-assisted wearable sensing-actuation system”为题,刚刚已发表在科学期刊 Nature Communications 上。


研究团队认为,该助听装置使用了一种全新的技术手段,不依赖于传统的声带,为语音障碍患者提供了一种新的沟通方式。


在患者中进一步测试后,该助听装置或使有嗓音障碍的个体能够更便捷地进行沟通和交流,进而提高整体生活质量。


会发声的柔性贴片


说话,是人际交往中最重要的组成部分,但对于有声带功能障碍的人来说,说话是一件难事。在一生中,约 30% 的人经历过至少一次的嗓音障碍。


现有的解决办法,比如手持电子喉设备或手术,或多或少地都存在影响日常生活、使用不舒适等问题。因此,我们亟需一种能辅助患者交流的可穿戴、非植入式的医疗装置,来改善声带功能障碍患者的生活质量。


在此次研究中,陈俊团队设计的柔性磁致弹性贴片,不仅能够很舒展地贴在患者喉部,还可以随参与说话运动的喉部肌肉改变形状,且不需要功能正常的声带。


同时,贴片的移动能检测到特定的肌肉运动,还能发电,让该助听装置实现自供电。这些运动随后会被转换成电信号,并由机器学习算法进行处理。该机器算法能够能识别词汇并翻译成语言信号。


图|磁弹性层结构参数。边长为 30mm。12 个半圆形单元,直径 2.16 毫米,在蛇形铜线圈中,跨度 25.92 毫米。比例尺为 10 毫米。


据论文描述,整个过程包括四个环节:信号采集、特征提取和压缩、机器学习分类、声音输出。


具体来说,该助听装置利用磁性材料与软物质系统中的磁性粉末相互作用的部分,可以导致材料的形变或运动,从而实现了喉部肌肉运动的信号采集。


随后,采集到的信号经过特征提取和压缩,利用主成分分析(PCA)将每个语音信号压缩成一个 N 阶矩阵,以减少数据的冗余,并为后续的分类做好准备。


然后,经过特征提取和压缩后的信号被输入到机器学习算法中进行分类。一旦机器学习算法对信号进行了分类,装置就会选择相应的声音信号进行输出。


最后,这些预先录制的声音信号通过助听装置的驱动部分被播放出来,从而实现了对应语音信号的输出,帮助使用者进行辅助说话。


图|机器学习辅助的无声带可穿戴语音装置


测试结果表明,即使在连续工作40分钟后,助听装置的声压和温度也没有出现明显的下降或升高。这表明了助听装置在声音输出方面的耐用性和安全性。


在耐汗性测试中,研究团队使用了人工汗液来模拟真实的使用环境。结果表明,即使在存在汗水的情况下,该助听装置的性能也表现得很稳定,没有出现明显的信号衰减。


在不同的正常谈话角度下,研究团队测试了助听装置的声音输出。结果显示,该助听装置在各种角度下都表现出了可靠的声音性能,这就使得其能够在多种真实生活场景中提供辅助言语。


然而,要想真正地帮助有声带障碍的患者,这种助听装置还存在一些局限性。


例如,研究中使用的实验样本量相对较小,且仅包括了特定年龄和性别的参与者,可能无法完全代表整个人群。未来的研究可以扩大样本量和范围,涵盖更广泛的人群。


此外,研究中使用了人工汗液模拟汗液环境,但这种环境与真实的生理环境仍存在差异。未来的研究可以更加接近真实生理环境,以更好地评估助听装置在实际使用中的表现。


充满想象的可穿戴设备


近年来,可穿戴设备的发展在不断地突破人类的想象。例如,一顶可清洗的帽子可以帮助视障人士感知交通信号灯的变化,或者一件衣服可以在穿着者浏览博物馆时充当导游。相关研究于上个月发表在 Nature 上。


上个月,同样发表在 Nature Communications 上的一项研究,其介绍的一种可穿戴情感识别系统,能够基于自供电的摩擦电原理,通过特制的传感器单元,同时感知面部和声音表达所产生的信号,从而实现对人类情感的准确识别。


再者,南开大学研究团队于去年在 Science 上发表的一篇论文,介绍了一种“冬天的取暖神器”,实现了全天太阳能供电的双向温度调节。


同样,可穿戴设备还可以化身一个可以任意变形的交互式屏幕,屏幕的显示内容与呈现形式可以根据你们的即时交互内容而实时变化,甚至让你有一种沉浸式的感官体验。


未来,当想象力坐上技术发展的快车,这些可穿戴设备将会在各种意义上让人类的生活变得便捷和美好。


参考链接:

https://www.nature.com/articles/s41467-024-45915-7 

https://samueli.ucla.edu/people/jun-chen/


本文来自微信公众号:学术头条 (ID:SciTouTiao),作者:学术头条

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定