人工智能可从嘈杂声中分辨特定声音
智能机器人 2025-03-24 14:09www.robotxin.com人工智能机器人网
人工智能(AI)设备如今已能处理来自个体的独立请求,但在某些复杂环境下,比如在喧闹的鸡尾酒会上或是多人同时交谈的场所,它们也会感到“困扰”。最近,《新科学家》杂志官网报道了美国剑桥三菱电机研究实验室的新发现:他们研发的声音识别AI设备,具备实时分离多个声源的能力,显著提升了自动语言识别的水平。
这一创新技术在日本东京先进技术综合展览会上首次亮相,其被团队称为“深度聚类”的机器学习技术,能够识别多个声源中的独特“声纹”。通过组合每个发言者声音的不同特征,该设备能从混杂的声音中筛选出特定特征的声音,并重建出每个人的发言内容。该智能技术经过多种语言的训练和学习,甚至能够轻松分辨出日本人说英语的声音。
传统的语音识别方法,比如通过两个模拟收音器模拟人耳的位置,只能达到约51%的准确性。这种被称为“鸡尾酒会效应”的问题困扰了AI研究领域几十年。新的智能系统成功地将两个人的语音进行分离,并且重建单人语音的精确度高达90%。新技术对于智能家庭、汽车等领域具有巨大潜力,它能同时分离多达五个人的声音,为电梯、空调机组和家用产品的智能操控提供了全新的可能性。
上一篇:工业机器人配件培训
下一篇:没有了