焉知汽车科技

  • 首页
  • 文章
  • 视频
  • 资料

瑞声科技:从“听见”到“听懂”,机器人量产落地离不开高质量感知前端

2026-03-31 17:01 411
摘要:
3月27日,在第二届焉知机器人大会上,瑞声科技以《听见未来,感知世界》为题发表演讲,围绕环境噪声干扰、机器人头部形态差异带来的拾音挑战,以及狭小空间内语音交互受限等行业痛点,展示了包括自适应ECNR算法、智能拾音算法、柔性拾音方案在内的软硬件协同感知声学解决方案。瑞声科技机器人听觉与发音部研发总监孙舒远在演讲中提到,机器人要真正走向落地,光“会动”还不够,“听得见、听得懂、能顺畅交互”正在成为越来越关键的一环。

3月27日,在第二届焉知机器人大会上,瑞声科技以《听见未来,感知世界》为题发表演讲,围绕环境噪声干扰、机器人头部形态差异带来的拾音挑战,以及狭小空间内语音交互受限等行业痛点,展示了包括自适应ECNR算法、智能拾音算法、柔性拾音方案在内的软硬件协同感知声学解决方案。瑞声科技机器人听觉与发音部研发总监孙舒远在演讲中提到,机器人要真正走向落地,光“会动”还不够,“听得见、听得懂、能顺畅交互”正在成为越来越关键的一环。


图片


这句话背后,其实对应着机器人行业正在发生的一个现实变化:当产品逐步从实验室走向工厂、商业空间、展厅和家庭,行业关注点也在悄然转移。过去,大家更在意机器人“能不能做出来”;而当产品进入导入与量产准备阶段后,市场更关心的,已经变成“能不能稳定用起来、持续交出去、在真实场景里跑得通”。在这样的背景下,运动能力、本体控制、整机形态仍然重要,但感知与交互的重要性也在同步上升。对机器人来说,能不能准确地去理解,去表达,正在越来越直接地影响它能不能真正被使用。


当机器人走进真实世界,感知能力的挑战会被迅速放大


在具身智能系统中,感知能力通常涵盖听觉、视觉、力觉、惯性等多个维度。但如果回到人机交互真正发生的起点,声音依然是最自然、最高频、也最符合人类习惯的入口之一。无论是消费电子时代的语音助手,还是车载座舱中的语音交互,行业已经反复证明:相比按键、触控等方式,语音更适合承担低门槛、低学习成本、可远距离触发的交互任务。对机器人而言尤其如此——当它进入家庭、工厂、商业空间等真实场景后,人与它建立连接的第一步,很多时候就是“先叫它,再让它理解你”。也正因如此,听觉感知不仅是具身智能的重要交互入口之一,也是瑞声科技现阶段最具能力延续性和现实价值的切入点。


但一旦走出实验室、进入开放环境,听觉感知系统面临的挑战也会被迅速放大,主要集中在三个方面。


图片


第一类,是物理环境挑战。

在商场、展会、工厂等场景中,持续且不可预测的环境噪声、本体电机噪声以及结构反射会叠加出现,直接拉低语音信号质量。


第二类,是交互性能挑战。

多人同时说话、目标说话人不断变化、机器人自身也处于移动状态,这会让声源定位、语音分离和交互稳定性都变得更加困难。


第三类,是本体设计挑战。

为了追求更好的工业设计和更紧凑的头部空间,声学系统往往欠缺理想布局条件,阵列排布受限、拾音距离缩短、抗噪性能妥协,都会成为真实交互体验的瓶颈。


这些问题叠加在一起,决定了听觉感知不再只是一个“交互入口”,而越来越接近整机体验的基础能力。机器人如果只能在安静环境中完成指令识别,就很难真正承担服务、协作和陪伴等更高阶任务。也正因此,“听得见、听得准、听得懂、能自然交互”,正在逐步成为衡量机器人可用性的一道门槛。


跨行业能力外溢,瑞声科技有备而来


与其说瑞声科技是在“进入”机器人行业,不如说,它正在把已经在消费电子、车载等成熟领域验证过的能力,系统性延展到具身智能场景中。过去30年里,瑞声科技在声学、传感、结构、制造和质量管理等方面形成了完整的技术与工程积累,如今,这些能力正沿着机器人产业链发生外溢,并转化为更贴近落地需求的解决方案能力。


从公开信息看,瑞声科技在机器人方向上的布局不只停留在单一器件层面,而是逐步延展至感知声学解决方案、运动关节、灵巧手结构单元、六维力传感及声学交互模块等多个方向。相比单点零部件供应,瑞声科技更希望建立的是“从关键模块到融合方案”的能力认知,也就是在机器人关键链路中,既提供性能和品质支撑,也提供更具工程化和量产可行性的合作方案。


此次从感知声学切入,正是这一能力外溢路径中最具现实落点的一步。对机器人行业来说,感知声学既是产品走向真实场景时绕不开的基础能力,也是最容易被环境噪声、结构约束和交互复杂度放大的关键环节;而对瑞声科技来说,这恰恰是其既有积累最容易形成延续与放大的方向。


从“听见”到“听懂”,瑞声科技在补哪一块


瑞声科技此次将机器人声学能力拆成了一条完整的技术链路:声学硬件层、信号处理层、声学感知层,以及具身决策层。对应到具体能力,既包括麦克风/麦克风阵列、扬声器/发声模组、声学结构件与电子处理模块,也包括AEC/NS、DOA/BF、本地/分级唤醒、语音识别、语义理解、声学事件监测,以及面向交互反馈和多模态融合的决策能力。换句话说,瑞声科技想呈现的不是“几项声学功能”,而是一套适应具身智能感知处理与决策反馈需求的、系统级、高质量、高鲁棒性、高性价比的稳定声学前端。


图片


从硬件层看,瑞声科技围绕机器人头部空间受限、结构复杂、拾音性能容易妥协等问题,展示了较完整的前端能力组合。例如,分布式有源模组具备小型化、可编程和长线驱动能力;标准环形/线形阵列适合更高性价比场景;柔性拾音麦克风阵列通过可弯曲结构、360°拾音和高信噪比定位,回应异形头部下的阵列适配难题;80dB光学麦克风则面向更高保真和更远距离交互场景。与之配套的,还有经典扬声器、微型扬声器,以及支持多通道输入和AI协处理的信号采集处理模块。重点已经不是器件堆叠,而是:如何在有限空间和复杂结构约束下,把一套可用的声学能力真正装进机器人本体。


图片


从算法与功能层看,瑞声科技展示的则是针对机器人场景高频痛点的能力组合。


第一类是围绕“听清”的能力。以自适应ECNR为例,其核心不是泛化地“做降噪”,而是同时覆盖抗环境噪声、抗自噪声、抗自发声和全双工交互,让机器人在商场、工厂等复杂环境中依然能保持稳定唤醒和有效识别。
 

第二类是围绕“听准”的能力。KWS关键词识别支持高精度和低时延;DOA声源角度识别可实现最高5°分辨率;BF定向拾音则通过指向性增益和可调波束提升远场拾音能力。进一步到“智能拾音算法”层面,带指向的唤醒识别、抗干扰声纹识别以及“唤醒+定位协同”,让机器人在复杂环境下实现更高唤醒率、更快响应和更稳的目标锁定。


第三类是围绕“听懂”与“领悟”能力。目标语音智能听觉通过自适应定向拾音与目标声纹识别,帮助机器人在多人场景中动态聚焦目标声源、过滤旁人干扰;更高一层的智能听觉与AED声事件监测,则进一步延展到说话人识别、语音过滤增强、个性化响应以及环境事件监测,最终服务于机器人的行为决策。


与此同时,瑞声科技也没有忽略“发音”环节。其重放方案覆盖人机自然交互、环境自适应重放、清晰度增强与聆听舒适度调节,目标是提升机器人语音输出的清晰度、自然度和长期聆听体验。也就是说,这套方案的目标并不只是让机器人“能听”,而是让它在输入与输出两端都更接近真实场景中的自然交互要求。


图片图片


对行业来说,瑞声科技带来的不只是器件


机器人行业真正稀缺的,并不只是性能更高的器件,而是能够把器件、算法、结构适配、测试验证和工程优化串起来的系统能力。很多感知问题在样机阶段并不明显,但一旦进入整机收敛、量产准备和真实场景验证阶段,就会集中暴露出来。


图片


整体来看,瑞声科技现阶段能给机器人行业带来的价值,主要体现在三点。


第一,是更贴近真实场景的感知声学能力。它回应的不是实验室里的“能不能听见”,而是复杂环境中“还能不能稳定听见、准确听懂、可靠交互”。


第二,是从模块走向方案的工程化支撑能力,把器件、算法、结构适配、测试验证和工程优化前置整合,就更有机会帮助客户缩短开发周期、提高可靠性和落地效率。


第三,是把成熟产业中的工程方法迁移到具身智能场景中。瑞声科技的目标并不是孤立卖出某一个声学器件,而是提供适应具身智能感知处理与决策反馈需求的稳定声学前端。这意味着,它正在把消费电子和汽车领域长期沉淀的结构、制造、调试与算法工程经验,转化成更接近机器人量产落地需求的能力平台。


不止于感知,AAC想做机器人的物理智能底座


目前,瑞声科技在机器人方向的布局,已经从声学感知进一步延展到了更完整的能力图景,包括多维感知系统、高精执行系统、精密结构系统和高效辅助系统。对应到具体能力,则涉及麦克风阵列、音频处理模块、扬声器、软件算法,也延展到惯性传感器芯片及模组、力矩传感器、关节执行器、结构件加工和散热方案等。


图片


瑞声科技这次真正想传递的,并不是“我们也进入了机器人行业”,而是:作为一个新进入者,瑞声科技正在把自己在声学、传感、结构、制造和工程化方面积累多年的能力,迁移到具身智能场景中,先从感知切入,再逐步延展至更完整的物理智能底座。


这既是瑞声科技拓宽技术边界、切入机器人赛道的现实路径,也是它持续投入、强化系统能力、打开新业务增长空间的一种方式。对行业而言,这样的玩家越多,机器人从“能展示”走向“能落地”的过程,或许也会更快一点。

评论 0

请先 登录 后再发表评论~

追光者

352

获赞

26

粉丝

2

关注

热门文章

IROS 2025现场直击:AC2发布获顶尖学者团认可,机器人之眼迎来突破性进展
IROS 2025现场直击:AC2发布获顶尖学者团认可,机器人之眼迎来突破性进展
芯驰科技E3650正式量产,22纳米旗舰MCU率先领跑下一代汽车架构
芯驰科技E3650正式量产,22纳米旗舰MCU率先领跑下一代汽车架构
爱芯元智今日登陆港交所:中国边缘AI芯片第一股诞生,智能汽车赛道加速突围
爱芯元智今日登陆港交所:中国边缘AI芯片第一股诞生,智能汽车赛道加速突围
新春集福 · 积分有礼,OpenLoong 开源社区春节活动官宣 !
新春集福 · 积分有礼,OpenLoong 开源社区春节活动官宣 !
2024年汽车行业展望
2024年汽车行业展望
知见:焉知智电产业1月刊【汽车人都关心的汽车事】
知见:焉知智电产业1月刊【汽车人都关心的汽车事】
汽车行业数字化转型白皮书:绸缪御风之术,臻于至善,业数合力创新,步步为营
汽车行业数字化转型白皮书:绸缪御风之术,臻于至善,业数合力创新,步步为营
黄仁勋之女首秀不谈芯片谈仿真,与李飞飞隔空呼应,英伟达下一盘“物理AI”大棋
黄仁勋之女首秀不谈芯片谈仿真,与李飞飞隔空呼应,英伟达下一盘“物理AI”大棋
智能驾驶计算芯片性能评测标准化白皮书
智能驾驶计算芯片性能评测标准化白皮书
嬴彻科技《自动驾驶卡车量产白皮书》102页
嬴彻科技《自动驾驶卡车量产白皮书》102页

更多精华美文扫码阅读

焉知汽车

焉知汽车

希骥电池与储能

希骥电池与储能

© 2018-2025 焉知 All Right Reserved · 沪ICP备15043037号-5 沪公网安备 31011502007507号