Bendi新闻
>
AI降噪耳机,可在嘈杂人群中单独通话,看一眼锁定目标
AI降噪耳机,可在嘈杂人群中单独通话,看一眼锁定目标
5月前
千万种声音里,只听到你。
论文《Look Once to Hear: Target Speech Hearing with Noisy Examples》:https://programs.sigchi.org/chi/2024/program/content/147319 GitHub 链接:https://github.com/vb000/LookOnceToHear
实现了带有噪声示例的注册网络。设计并比较了两个不同的注册网络 —— 波束形成器网络和知识蒸馏网络 —— 以使用短双耳噪声示例即可有效生成一个可捕捉目标说话人特征的嵌入向量。 实时嵌入式的目标语音听觉网络。TSH 使用生成的嵌入,随后使用 IoT 级别 CPU 上实时运行的优化网络提取目标语音。为此,研究者探索了各种模型和系统级优化,实现了在嵌入式设备上实时运行的轻量级目标语音听觉网络。 推广到现实世界的多径、HRTF 和移动性。作者提出了一种训练方法,仅使用合成数据,也可以保证系统不会被现实世界中未见过的目标干扰。 此外,该研究明确使用多路径进行训练,以推广到室内和室外环境。作者还引入了一种微调机制,可以解决移动源和听众头部方向的突然变化(高达 90°/s 的角速度),并允许系统在注册期间处理听者头部方向多至 18° 的误差。
© THE END
转载请联系本公众号获得授权
投稿或寻求报道:[email protected]
微信扫码关注该文公众号作者
来源:机器之心
相关新闻
你的耳机要被 AI 颠覆了:只需看一眼,整个世界都是 TA 的声音小心!最新AI看一眼照片就定位你在哪里,精确到经纬度谁要花钱看AI成龙啊从“萝卜快跑”看AI应用的基本原则印度外包、AI降本……地狱模式下的北美,还有哪些WLB天花板公司?联想:6大AI看点,让硅基觉醒飞利浦强发明“AI耳机”,隐藏1绝技,带上秒懂16国语言激增13倍,从关键数据看AI市场规模从美国软件企业的统计数据看AI的发展情况 |5Y View看AI「爆改」千行百业!36氪新质生产力·AI Partner大会成功举办从Q1财报,看AI对百度的驱动力谷歌 I/O 发 AI 全家桶,AI 搜索很快到来;OpenAI 首席科学家离职;Meta 研究带摄像 AI 耳机|极客早知道Meta被曝开发配备摄像头的AI耳机,可识别物体和翻译看AI+房产数智化营销,如何发挥AI新质生产力实现获客增长?在星野看 AI 们互相“扯淡”,比看人类有意思多了!|AI教程三甲小主治:急着发文,我用AI降重,竟差点被判学术不端……晚点财经丨台积电:今年剩下日子就看 AI 了;欧莱雅中国打算 “顺其自然”;全球产业大扶持的一年透过生成式AI看企业安全 亚马逊CSO Steve Schmidt如是说老师我可以用AI降重吗?AI降重的效果好吗?老师:可以是可以,就是……看AI如何回答麻醉医生在手术室的地位AI看视频自动找“高能时刻”,相关论文已被AAAI 2024收录AI看视频自动找“高能时刻”|字节&中科院自动化所@AAAI 2024安卓“机皇”降临!三星S24搭载最强AI,通话实时翻译,体验逆天…AI看图猜位置,准确率超90%!