华盛顿大学开发AI系统“目标语音听觉”

续航客服微信二维码-black

留学申请微信咨询

微信扫描左侧二维码

点击下方按钮咨询

联系客服

在现代社会中,嘈杂的环境常常使得人与人之间的交流变得困难,尤其是在机场、工业车间或大型展览会等场所。为了应对这一挑战,华盛顿大学(2024USNews美国大学排名:40)的研究团队开发了一种名为“目标语音听觉”的人工智能系统。这一系统能够让佩戴耳机的用户通过注视某人3到5秒钟来“注册”该人,然后在嘈杂环境中取消所有其他声音,仅播放注册者的声音。这一创新技术在2024年5月14日于檀香山举行的ACM CHI计算系统人因会议上展示,受到了广泛关注。

华盛顿大学的AI系统:目标语音听觉

华盛顿大学的研究人员开发的“目标语音听觉”系统,旨在帮助用户在嘈杂环境中专注于特定的声音。用户佩戴装有麦克风的耳机,按下按钮并将头部对准说话者,耳机将声音信号发送到嵌入式计算机,机器学习软件学习说话者的声音模式,并在用户移动时继续播放。该系统不仅适用于室内外环境,还能跟踪说话者在环境中的移动。

研究人员表示,该系统在嘈杂的注册音频中实现了7.01 dB的信号质量提升,并且可以在嵌入式CPU上实时处理音频。尽管系统是基于合成数据训练的,但它能够推广到现实世界中未见过的目标和干扰说话者及其头部相关传递函数。研究人员还引入了一种微调机制,以应对移动源和听者头部方向的突然变化。

ACM CHI 2024会议上的展示

在2024年5月28日,HealthDay报道了一种新的AI耳机技术,能够帮助用户在嘈杂的环境中“调谐”到特定的人声,从而更好地听到说话者的声音。这种名为“目标语音听觉”的系统允许用户佩戴耳机并注视某人说话3到5秒钟,以“注册”该说话者。AI随后会取消环境中的所有其他声音,只播放注册的说话者的声音,即使听者在移动且不再面对说话者。

华盛顿大学的计算机科学与工程教授Shyam Gollakota表示:“有了我们的设备,即使在嘈杂的环境中,你也能清晰地听到单个说话者的声音。”该AI系统模仿并改进了人脑专注于单一说话者声音的能力。使用该系统时,佩戴带有麦克风的耳机的人需要在直接看着某人说话时按下按钮。说话者声音的声波到达耳机两侧的麦克风,信号被转发到耳机内安装的AI。AI学习说话者的声纹,并继续播放该人的声音,即使说话者和听者在移动。研究人员表示,随着说话者继续说话,系统专注于说话者的能力会有所提高。

研究团队在21人身上测试了该系统,受试者对注册说话者声音的清晰度评分平均比未过滤的音频高出近一倍。尽管这些发现尚未在同行评审的期刊上发表,但研究团队已经公开了其概念验证设备的计算机代码,供他人构建。目前,该系统只能一次注册一个说话者,如果同一方向有另一个大声的声音,则无法注册说话者。研究团队正在努力将该系统扩展到耳塞和助听器中。

当前AI听觉系统的局限性

尽管“目标语音听觉”系统展示了其在嘈杂环境中筛选和放大特定声音的潜力,但它仍然存在一些局限性。首先,该系统目前只能注册一个说话者,且在目标说话者声音方向没有其他大声声音时才能注册。这意味着在非常嘈杂的环境中,系统的效果可能会受到限制。

此外,人工智能(AI)技术虽然在许多领域取得了显著进展,但其应用仍然面临一些挑战。根据普华永道的预测,到2035年,人工智能可能为全球经济贡献15.7万亿美元。然而,人工智能的实现需要大量的数据和计算资源,这使得其实施成本较高。此外,人工智能系统在处理复杂和多变的环境时,可能无法复制人类的创造力和灵活性。

人工智能的类型包括纯反应型、有限记忆型、心智理论型和自我意识型。机器学习和深度学习是实现人工智能的两种主要方法。机器学习通过算法从数据中发现模式并生成见解,而深度学习则模仿人脑的神经网络结构。尽管这些技术在许多领域取得了成功,但在处理实时音频和复杂的听觉环境时,仍然需要进一步的研究和优化。

未来计划:耳塞和助听器中的AI听觉系统

尽管当前的“目标语音听觉”系统存在一些局限性,但研究团队已经在努力将该系统扩展到耳塞和助听器中。苹果公司最近宣布了将AirPods作为助听器的新功能,这一创新可能会改变听力支持的现状。AirPods Pro(第二代)被认为是最适合作为助听器替代品的型号,其功能包括“实时聆听”、对话增强、噪音消除和透明模式等,这些功能可以帮助有轻度到中度听力损失的人改善听力。

“实时聆听”功能将iPhone或iPad变成定向麦克风,将声音直接发送到AirPods,帮助用户在嘈杂环境中更好地听到讲话声。“对话增强”功能则可以在嘈杂环境中帮助用户更好地听到面对面交流的声音。噪音消除和透明模式则提供了更好的听觉体验,前者减少背景噪音,后者则让用户能够听到周围的环境声音。

此外,AirPods还提供了放大音频的功能,可以放大较弱的声音并减少背景噪音。用户还可以通过Mimi应用程序进行听力测试,并根据测试结果定制音频设置。空间音频和头部跟踪功能则提供了沉浸式的声音体验。

苹果还计划在下一代AirPods中加入体温测量和USB-C充电功能,这将进一步提升其功能和实用性。尽管AirPods在某些方面与传统助听器相媲美,但要真正与之竞争,仍需获得FDA批准、提供更全面的声音调整和更长的电池寿命。

AirPods作为助听器的潜力不仅在于其技术创新,还在于其相对较低的成本和广泛的社会接受度。对于年轻人和老年人来说,AirPods可能是一个更具吸引力的选择,尤其是对于那些不愿意使用传统助听器的人群。然而,AirPods的电池寿命较短和需要与iPhone或iPad配合使用等问题,可能会影响其在老年人中的普及。

综合总结

华盛顿大学开发的“目标语音听觉”系统展示了人工智能在听觉领域的巨大潜力。通过在嘈杂环境中筛选和放大特定声音,该系统为用户提供了更清晰的听觉体验。然而,当前系统的局限性和人工智能技术的挑战仍需进一步研究和优化。未来,随着技术的不断进步和应用的扩展,AI听觉系统有望在耳塞和助听器中得到广泛应用,为更多有听力需求的人群提供帮助。

总的来说,人工智能在听觉领域的应用前景广阔,但仍需克服技术和应用上的挑战。随着研究的深入和技术的进步,我们有理由相信,未来的AI听觉系统将为人们带来更加便捷和高效的听觉体验。

参考新闻资料:

  1. AI headphones let wearer listen to a single person in a crowd, by looking at them just once
  2. Real-time Filtering With Artificial Intelligence Improves Hearing
  3. AI Headphones Let Listeners Hear Just One Voice in a Crowd
  4. What is Artificial Intelligence and Why It Matters in 2024?
  5. AirPods as Hearing Aids: New Features Announced

【独家稿件声明】本文为美国续航教育(Forward Pathway LLC,官网地址:www.forwardpathway.com)原创,未经授权,任何媒体和个人不得全部或者部分转载。如需转载,请与美国续航教育联系;经许可后转载务必请注明出处,违者本网将依法追究。

美国续航教育总部位于美国加利福尼亚州洛杉矶,同时在中国上海和深圳设有续航教育分部。续航教育自2013年成立以来,致力于研究中美之间的文化教育发展与趋势,提供最专业的美国留学一站式服务,获得美国国际招生协会AIRC及国际教育顾问委员会ICEF的双重认证。

美国招生协会
AIRC权威认证

2000+ TOP50
成功申请案例

7000+ 学校
独家数据库信息支持

点击了解详情

留学宝典

史上最全留学指南

续航客服微信二维码-black

咨询留美申请详情

微信扫描左侧二维码

点击下方按钮咨询

联系客服

觉得有用的话就评价/分享一下吧~

留学宝典

美国留学宝典

史上最全留学指南

联系我们

24小时在线客服咨询

先试试我们的AI小助手吧,回答各类留学问题!

 续航教育企业微信客服二维码

⬆⬆⬆微信扫码咨询

或点击下方按钮


联系电话:
+1 412-230-8666

邮箱:
[email protected]

Generic filters
Exact matches only