你可能没有听过 “鸡尾酒会效应”,但是你一定体验过下面这种情景:在嘈杂的聚会中,你仍能注意力集中在与某人的谈话上,忽略掉其他对话和喧闹的背景音乐,这是人类听力中神奇的“听力选择”能力。但这种能力并不是所有人都拥有,对于听力障碍人士来说,就算带有助听器,也无法有效分离声音。
不过,这个问题很快就会成为历史。奥尔堡大学的科研人员开发了一种突破性算法,可以在未知的声音环境中有效地识别并分离声音,帮助听力障碍人士感受“鸡尾酒效应”,参与到日常对话中。奥尔堡大学工程类专业世界排名第四(global state engineering eucation 2018)
智能助听器的愿景
来自奥尔堡大学(aau)声学信号处理研究中心的博士morten kolbæk开发了一种可以在未知嘈杂的环境中分离声音的算法,突破了原有助听器只能在已知环境情况下才能良好运行的技术。丹麦奥迪康高级研究员,奥尔堡大学jesper jensen教授表示:“morten kolbæk的新算法能够在未知的声音环境中运行,这种算法的适用性比我们在之前的技术中看到的要强得多。这是解决日常生活中最具有挑战的听力情境的重要一步。”该项目主管zheng-hua tan教授也认为该算法在声学研究中有重要潜力:“该算法成功的关键在于它能够从数据中学习,然后构建复杂收听情境的强大统计模型。这种方案即使在全新和未知的声音环境下也能很好地工作。”
降噪和语音分离
该研究首先帮助助听器用户解决嘈杂空间中无法进行“一对一”对话的挑战。morten kolbæk开发了可以放大扬声器声音,同时降低噪音的算法。尽管目前的助听器已针对多种不同情况进行了预编程,但现实生活中随着环境的不断变化,仍需要建立能够立即读取特定情况的助听器。该研究其次围绕语音分离展开,是一种可以降低噪声,同时可以分离语言的算法。这种算法可以说是第一种研究的延伸,适用于有多个发言者的场景,用户可以有选择性地进行聆听。
深度神经网络
用于这种创造算法的方法是机器学习中“深度学习”的一类,也就是使用深度神经网络算法复制大脑倾听和处理人类语音的方式。“比如说想要研究噪声中的语言,需要先对计算机提供噪声环境中的语音样本和没有任何噪声的语音样本,算法可以学习如何把有噪声的信号处理成清晰的语音信号,”jesper jensen教授解释道。zheng-hua tan教授告诉我们,深度学习能力来自其分层结构,通过逐层处理将嘈杂或混合的语音信号转换为干净或分离的语音。今天深度学习能够被广泛使用源于三个主要因素:不断增强的计算能力、训练算法大数据量的增加和训练深度神经网络新方法的出现。
这么伟大而神奇的专业,是否吸引了你的注意?如果你也想利用声学技术改变生活,奥尔堡大学欢迎你的加入!
想获得一对一免费指导吗?想要一套量身定制的留学方案吗?联系我,给您想要的!