Geometric model of human factor parameters for channel identification for active noise control
-
摘要:
研究了一种基于人因参数几何模型的声学通路辨识策略, 可用于有源降噪技术中的通路辨识环节, 以降低因人体姿态改变而导致的降噪性能退化。该策略利用深度相机输出的点云数据提取人因参数并构建几何模型, 通过仿真和人工神经网络预测声学通路的传递函数矩阵。结果表明, 人因参数几何模型的降噪性能与点云模型接近, 适用于参数化扫描仿真。进一步通过实验验证了仿真的准确性以及所提策略的可行性。实验结果还表明, 人体姿态改变会导致声学通路传递函数发生复杂且显著的变化, 说明实际应用应考虑人体姿态改变所带来的影响。
Abstract:This paper introduces an approach to acoustic channel identification rooted in a geometric model that accounts for human factors. This method holds promise for applications in active noise control technology, specifically addressing the challenge of maintaining optimal noise reduction performance despite the changes in human posture. The approach involves extracting human factor parameters from the point cloud data acquired through a depth camera, which are then used to construct a precise geometric model. This model is utilized to predict the transfer function matrix of the acoustic channel through simulation and artificial neural networks. The results demonstrate that the geometric model incorporating human factor parameters yields noise reduction performance comparable to that of the traditional point cloud models, making it an attractive option for parametric scanning simulations. Furthermore, experimental verification also validates the accuracy of the simulated results and the feasibility of the proposed approach. The findings show the significant impact of changing human posture on the complexity and variability of the acoustic channel, emphasizing the importance of the posture effects in real-world applications.
-
引言
持续或高强度的噪声会危害人的身心健康 [1-2], 有源噪声控制(ANC)技术可以保护听力或提升听觉体验 [3-5]。为有效估计人耳附近的声压作为参考信号, 有源噪声控制中可使用虚拟传感技术[6-8]。相关研究在辨识环节测量虚拟传声器与观测传声器之间的传递函数矩阵, 在控制环节利用物理传声器和传递函数矩阵预测虚拟传声器的信号[8]。
然而, 实际应用中, 使用者往往会调整身体姿态, 使得降噪的目标区域随人耳移动, 肩颈与人耳之间的位置关系也会随之变化。这使ANC系统在辨识环节所得到的传递函数矩阵与实际情况失配, 导致ANC系统的降噪效果退化, 甚至引起系统失稳[9]。为了克服这一问题, 学者们提出了不同的技术路线: (1) 使用额外的穿戴式传感器[10-11]; (2) 引入在线辨识环节, 增加传声器通道或算法约束 [12-14]; (3) 利用运动跟踪器更新系统模型[15]。相较于其他技术方案, 利用运动跟踪器的方案不需佩戴额外装置, 使用体验更优, 具有广阔的应用前景。
人头运动对ANC系统降噪效果的影响一直备受关注[16]。起初, Petersen在一维波导中实现了移动虚拟传感技术[17], 证实了及时更新次级路径能够提升静区的降噪量。2008年, Moreau等在扩散场假设下考虑了人头转动对ANC系统的影响, 并通过实验验证了移动虚拟传感技术在类舱室环境下的可行性[13]。近年, 随着3D建模技术的发展, 深度相机已经能够构建精细的头身模型[18-19], 并实时追踪人体的运动[20]。这使得ANC技术有望实现声学通路的在线辨识。Eillott等使用深度相机作为运动跟踪器, 实时获取人头移动下双耳的空间坐标, 结合预先测量的数据库更新ANC头靠的传递函数矩阵, 并通过实验验证了系统的鲁棒性[15]。以上研究证实了运动跟踪器能够提升ANC系统的降噪效果。目前已有研究中, 运动跟踪器所感知的运动仅限于人工头的头部转动和整体平移[21], 这与实际人体姿态存在较大差异, 因此基于运动跟踪器的ANC技术仍需进一步完善。
为促进ANC技术的应用, 本文提出了一种基于人因参数几何模型的通路辨识策略; 通过数值仿真验证了该几何模型的有效性, 对比评估了所提策略下ANC系统的降噪性能; 通过实验研究了转头运动下边界元仿真的有效性, 并通过实验验证了本文所提技术路线的可行性。本文所提策略同时考虑了人体几何尺寸与多维运动姿态, 能够提升在线辨识精度, 对类舱室环境中的ANC技术应用具有重要意义。
1. 远程传声器技术框架
依据ANC系统架构的不同, 虚拟传感技术存在众多子类[7]。其中远程传声器(RM)技术能够显式地估计参考信号, 更易于移动虚拟传感的实现。这使得已有的基于运动跟踪器的ANC技术均以RM技术为主[15,21]。
图1是RM的物理概念图。
{{\boldsymbol{r}}_{{\text{\{ }} \cdot {\text{\} }}}} 是声源或传声器的空间坐标,{{\boldsymbol{r}}_{{\text{\{ }} \cdot {\text{\} }}}} 的脚标为P ,G ,m ,e , 分别对应于初级声源(被控制噪声源)、次级声源(控制扬声器)、观测传声器(物理传声器)和误差传声器(虚拟传声器)。为便于分析, 在频率域讨论信号模型。{{\boldsymbol{P}}_{{\text{\{ }} \cdot {\text{\} }}}} 和{{\boldsymbol{G}}_{{\text{\{ }} \cdot {\text{\} }}}} 分别是初、次级声源的传递函数矩阵, 其脚标是m 或e , 分别对应于观测传声器和误差传声器。辨识环节中, RM技术使用已知的声源进行激励, 在
{{\boldsymbol{r}}_{\text{e}}} 与{{\boldsymbol{r}}_{\text{m}}} 处使用物理传声器采集信号, 以此得到辨识的传递函数矩阵, 记为{\widehat {\boldsymbol{P}}_{{\text{\{ }} \cdot {\text{\} }}}} 和{\widehat {\boldsymbol{G}}_{{\text{\{ }} \cdot {\text{\} }}}} 。该类矩阵包含了初、次级声源到各个传感器的传递路径特征, 被存储在内存中, 在控制环节中用来生成控制信号。{\widehat {\boldsymbol{P}}_{{\text{\{ }} \cdot {\text{\} }}}} 和{\widehat {\boldsymbol{G}}_{{\text{\{ }} \cdot {\text{\} }}}} 的精度是降噪效果和系统稳定性的关键。但受多种因素影响, 其与实际的传递函数矩阵{{\boldsymbol{P}}_{{\text{\{ }} \cdot {\text{\} }}}} 和{{\boldsymbol{G}}_{{\text{\{ }} \cdot {\text{\} }}}} 存在偏差, 此即模型失配。为了有效评估模型失配的情况, 使用降噪量(Noise Reduction,{R_{\rm NR}} )来表征系统性能, 其定义为{R_{{\text{NR}}}} = - 10{\log _{10}}\left\{ {\frac{{{\text{Tr}}\left[ {\mathbb{E}(\widetilde {\boldsymbol{e}}{{\widetilde {\boldsymbol{e}}}^{\rm H}})} \right]}}{{{\text{Tr}}\left[ {\mathbb{E}({{\boldsymbol{d}}_{\text{e}}}{\boldsymbol{d}}_{\text{e}}^{\text{H}})} \right]}}} \right\}, (1) 其中,
{\text{Tr}}\{ \cdot \} 代表矩阵的迹,\mathbb{E}\{ \cdot \} 代表期望,{\{ \cdot \} ^{\text{H}}} 代表矩阵的共轭转置,{{\boldsymbol{d}}_{\text{e}}} 为初级声源在误差传声器处引起的扰动,\widetilde {\boldsymbol{e}} 为误差传声器处残余噪声的估计值。{{\boldsymbol{d}}_{\text{e}}} 和\widetilde {\boldsymbol{e}} 分别定义为{{\boldsymbol{d}}_{\text{e}}} = {{\boldsymbol{P}}_{\text{e}}}{\boldsymbol{x}} ,\tag{2a} \widetilde {\boldsymbol{e}} = {{\boldsymbol{d}}_{\text{e}}} + {{\boldsymbol{G}}_{\text{e}}}{{\boldsymbol{W}}_{{\text{RM}}}}{\boldsymbol{x}}{\text{ }}, \tag{2b} 其中,
{\boldsymbol{x}} = {\boldsymbol{Rv}} 是参考信号,{\boldsymbol{v}} 是初级源的信号,{\boldsymbol{R}} 是{\boldsymbol{v}} 到{\boldsymbol{x}} 的传递函数, 文中为简化模型复杂度, 仅考虑初级源完全已知的情况, 故设{\boldsymbol{R}} 为单位矩阵{\boldsymbol{I}} ;{{\boldsymbol{W}}_{{\text{RM}}}} 是ANC系统中的控制滤波器。{{\boldsymbol{W}}_{{\text{RM}}}} 的表达式随信号假设和ANC系统架构的不同而变化。本文以经典的前馈滤波LMS (FxLMS)为系统架构, 其{R_{{\text{NR}}}} 的表达式可以写成传递函数矩阵的形式[22]:{R_{\rm NR}} = - 10{\log _{10}}\left\{ {\frac{{{\mathrm{Tr}}\left[ {({{\boldsymbol{P}}_{\text{e}}} + {{\boldsymbol{G}}_{\text{e}}}{{\boldsymbol{W}}_{{\text{RM, }}\infty }}){{\boldsymbol{S}}_{vv}}{{({{\boldsymbol{P}}_{\text{e}}} + {{\boldsymbol{G}}_{\text{e}}}{{\boldsymbol{W}}_{{\text{RM, }}\infty }})}^{\mathrm{H}}}} \right]}}{{{\mathrm{Tr}}\left[ {{{\boldsymbol{P}}_{\text{e}}}{{\boldsymbol{S}}_{vv}}{\boldsymbol{P}}_{\text{e}}^{\mathrm{H}}} \right]}}} \right\}, (3) 其中,
{{\boldsymbol{S}}_{vv}} 是{\boldsymbol{v}} 的协方差矩阵, 这里假设初级源在时频域满足独立同分布条件, 从而{{\boldsymbol{S}}_{vv}} = \sigma {\boldsymbol{I}} , 其中\sigma 为源强,{\boldsymbol{I}} 为单位矩阵;{{\boldsymbol{W}}_{{\text{RM,}}\infty }} 的表达式为[22]{{\boldsymbol{W}}_{{\text{RM,}}\infty }} = - {\left[ {\widehat {\boldsymbol{G}}_{\text{e}}^H{{\boldsymbol{G}}_{{\text{RM}}}}} \right]^{ - 1}}\widehat {\boldsymbol{G}}_{\text{e}}^H{\widehat {\boldsymbol{O}}_{{\text{Opt}}}}{{\boldsymbol{P}}_{\text{m}}}{\text{ ,}} (4) 其中,
{{\boldsymbol{G}}_{{\text{RM}}}} 为ANC系统的等效传递函数矩阵,{\widehat {\boldsymbol{O}}_{{\text{Opt}}}} 为辨识环节获得的最优观测矩阵。{{\boldsymbol{G}}_{{\text{RM}}}} 和{\widehat {\boldsymbol{O}}_{{\text{Opt}}}} 可写为[22]{{\boldsymbol{G}}_{{\text{RM}}}} = {\widehat {\boldsymbol{G}}_{\text{e}}} + {\widehat {\boldsymbol{O}}_{{\text{Opt}}}}({{\boldsymbol{G}}_{\text{m}}} - {\widehat {\boldsymbol{G}}_{\text{m}}}){\text{ ,}} \tag{5a} {\widehat {\boldsymbol{O}}_{{\text{Opt}}}} = {\widehat {\boldsymbol{P}}_{\text{e}}}\widehat{\boldsymbol{ P}}_{\text{m}}^{\mathrm{H}}{({\widehat {\boldsymbol{P}}_{\text{m}}}\widehat {\boldsymbol{P}}_{\text{m}}^{\mathrm{H}})^{ - 1}}{\text{ }}{\text{.}}\tag{5b} 除
{R_{{\text{NR}}}} 外, 通过分析ANC系统的频域响应, 还可以得到该系统的收敛判据[23]。对RM技术而言, 其收敛判据为[15]\mathcal{R}\left\{ {{\text{eig}}\left[ {\widehat {\boldsymbol{G}}_{\text{e}}^{\text{H}}{{\widehat {\boldsymbol{G}}}_{\text{e}}} - \widehat {\boldsymbol{G}}_{\text{e}}^{\text{H}}{{\widehat {\boldsymbol{O}}}_{{\text{Opt}}}}\Delta {{\boldsymbol{G}}_{\text{m}}}} \right]} \right\} > 0{\text{ }}, (6) 其中,
\Delta {{\boldsymbol{G}}_{\text{m}}} = {\widehat {\boldsymbol{G}}_m} - {{\boldsymbol{G}}_m} ,\mathcal{R} 代表取实部,{\text{eig}} 代表取矩阵的特征值。由式(1)至式(6)可知,
{R_{{\text{NR}}}} 与收敛判据均由{{\boldsymbol{P}}_{{\text{\{ }} \cdot {\text{\} }}}} ,{{\boldsymbol{G}}_{{\text{\{ }} \cdot {\text{\} }}}} ,{\widehat {\boldsymbol{P}}_{{\text{\{ }} \cdot {\text{\} }}}} ,{\widehat {\boldsymbol{G}}_{{\text{\{ }} \cdot {\text{\} }}}} 计算得到。后文将据此定量评估RM技术下ANC系统的性能与稳定性。2. 基于人因参数几何模型的在线辨识策略
2.1 在线辨识策略
如图2所示, 深度相机能够实时输出点云, 从中可以提取人体测量学参数和骨架节点坐标。然而RM技术的辨识目标是传递函数矩阵
{{\boldsymbol{P}}_{{\text{\{ }} \cdot {\text{\} }}}} 和{{\boldsymbol{G}}_{{\text{\{ }} \cdot {\text{\} }}}} 。因此需要构建一个预测模型, 基于深度相机输出的信息更新传递函数矩阵。已有研究中, 人工头被放置在座椅的不同位置上, 实测获得人工头坐标与传递函数矩阵之间的映射关系, 以此作为预测模型[15,21]。但是, 人工头无法完备地表征人体各种姿态。因此, 本文提出了基于人因参数的几何模型。该模型在人体测量学参数基础上引入了骨架节点坐标, 能够模拟不同体型和姿态的情况。分别以初级与次级声源作为激励, 使用边界元法对所提几何模型进行仿真, 从而获取预测所需的传递函数矩阵。
在实际应用中, 边界元仿真难以满足实时辨识的需求。对此, 可预先在人因参数空间采样, 通过仿真构建数据集并训练人工神经网络, 以此作为预测模型, 能够实时预测传递函数矩阵。
2.2 人因参数几何模型
人因参数几何模型是构建预测模型的重要基础。人因参数被分为几何参数和运动参数两种, 分别由图2中的人体测量学参数和骨架节点坐标得到。本文所使用的坐标系如图3所示。图中, 头身几何被拆解为四个部分, 头(H)、颈(N)、肩(S)以及身(T)。四部分的节点坐标分别记为
{{\boldsymbol{u}}_{\text{H}}} ,{{\boldsymbol{u}}_{\text{N}}} ,{{\boldsymbol{u}}_{\text{S}}} ,{{\boldsymbol{u}}_{\text{T}}} (运动参数)。设{{\boldsymbol{u}}_{\text{H}}} 的初始位置与原点重合, 节点之间存在关系:{{\boldsymbol{u}}_{\text{N}}} = {{\boldsymbol{u}}_{\text{H}}} + {L_{\text{N}}}{{\boldsymbol{n}}_{\text{N}}}\left( {{\theta _{\text{N}}},{\phi _{\text{N}}}} \right){\text{ }},\tag{7a} {{\boldsymbol{u}}_{\text{S}}} = {{\boldsymbol{u}}_{\text{N}}} + {L_{\text{S}}}{{\boldsymbol{n}}_{\text{S}}}\left( {{\theta _{\text{S}}},{\phi _{\text{S}}}} \right){\text{ }}, \tag{7b} {{\boldsymbol{u}}_{\text{T}}} = {{\boldsymbol{u}}_{\text{S}}} + {L_{\text{T}}}{{\boldsymbol{n}}_{\text{T}}}\left( {{\theta _{\text{T}}},{\phi _{\text{T}}}} \right){\text{ }},\tag{7c} 其中,
{L_{\{ \cdot \} }} 是当前节点与上一节点之间的距离(几何参数),{{\boldsymbol{n}}_{\{ \cdot \} }} 为上一节点到当前节点的单位矢量(运动参数)。使用几何体拟合每个节点所对应的身体部位。其中, 头是一个椭球体, 肩、颈与身各与一个椭圆环对应。椭球长轴或椭圆法向所对应的矢量记为
{{\boldsymbol{m}}_{\{ \cdot \} }}\left( {{\alpha _{\{ \cdot \} }},{\beta _{\{ \cdot \} }}} \right) (运动参数), 几何体绕{{\boldsymbol{m}}_{\{ \cdot \} }} 轴转动的角度记为{\gamma _{\{ \cdot \} }} (几何参数), 如图4所示。实际中, 人的运动是有限的, 运动参数之间存在耦合, 比如头颈转动角度相同, 肩身转动角度相同等。如若不加以限制, 将导致异常的人体姿态或冗余的人因参数样本[24]。通过如表1所示的约束可以将运动参数缩减为11个独立的标量:
{{\boldsymbol{u}}_{\text{H}}}\left( {{u_{{\text{H}},{x}}},{u_{{\text{H}},{y}}},{u_{{\text{H}},{\textit{z}}}}} \right) ,{{\boldsymbol{m}}_{\text{H}}}\left( {{\alpha _{\text{H}}},{\beta _{\text{H}}}} \right) ,{\gamma _{\text{H}}} ,{\gamma _{\text{S}}} ,{{\boldsymbol{n}}_{\text{N}}}\left( {{\theta _{\text{N}}},{\phi _{\text{N}}}} \right) ,{{\boldsymbol{n}}_{\text{T}}}\left( {{\theta _{\text{T}}},{\phi _{\text{T}}}} \right) 。这些标量可由深度相机扫描获得。表 1 运动参数及参数耦合约束{{\boldsymbol{u}}_{\{ \cdot \} }} {{\boldsymbol{n}}_{\{ \cdot \} }}\left( {{\theta _{\{ \cdot \} }},{\phi _{\{ \cdot \} }}} \right) {{\boldsymbol{m}}_{\{ \cdot \} }}\left( {{\alpha _{\{ \cdot \} }},{\beta _{\{ \cdot \} }}} \right) {\gamma _{\{ \cdot \} }} 头 {{\boldsymbol{u}}_{\text{H}}} {\mathit{u}}_{\mathrm{H}} — {{\boldsymbol{m}}_{\text{H}}} {\gamma _{\text{H}}} 颈 {{\boldsymbol{u}}_{\text{N}}} = {{\boldsymbol{u}}_{\text{H}}} + {L_{\text{N}}}{{\boldsymbol{n}}_{\text{N}}}\left( {{\theta _{\text{N}}},{\phi _{\text{N}}}} \right) {{\boldsymbol{n}}_{\text{N}}} {{\boldsymbol{m}}_{\text{N}}} = {{\boldsymbol{n}}_{\text{N}}} {\gamma _{\text{N}}} = {\gamma _{\text{H}}} 肩 {{\boldsymbol{u}}_{\text{S}}} = {{\boldsymbol{u}}_{\text{N}}} + {L_{\text{S}}}{{\boldsymbol{n}}_{\text{S}}}\left( {{\theta _{\text{S}}},{\phi _{\text{S}}}} \right) {{\boldsymbol{n}}_{\text{S}}} = {{\boldsymbol{n}}_{\text{N}}} {{\boldsymbol{m}}_{\text{S}}} = {{\boldsymbol{n}}_{\text{S}}} {\gamma _{\text{S}}} 身 {{\boldsymbol{u}}_{\text{T}}} = {{\boldsymbol{u}}_{\text{S}}} + {L_{\text{T}}}{{\boldsymbol{n}}_{\text{T}}}\left( {{\theta _{\text{T}}},{\phi _{\text{T}}}} \right) {{\boldsymbol{n}}_{\text{T}}} {{\boldsymbol{m}}_{\text{T}}} = {{\boldsymbol{n}}_{\text{T}}} {\gamma _{\text{T}}} = {\gamma _{\text{S}}} 几何参数能够模拟不同体型的使用者, 与运动参数一样重要。其中, 人头所对应的椭球具有3个轴, 其长度记为
{{\boldsymbol{D}}_{\text{H}}}\left( {{D_{{\text{H}},{x}}},{D_{{\text{H}},{y}}},{D_{{\text{H}},{\textit{z}}}}} \right) 。颈、肩和身由椭圆环代表, 其长度记为{{\boldsymbol{D}}_{\{ \cdot \} }}\left( {{D_{\{ \cdot \} ,1}},{D_{\{ \cdot \} ,2}}} \right) 。如表2所示, 几何参数由12个独立的标量组成。这些参数可以由深度相机扫描获得。对于成年人而言, 其人体测量学参数具有较为集中的分布, 而且参数之间存在相关性[25]。这一特点可进一步降低模型复杂度。表 2 几何参数约束{L_{\{ \cdot \} }} {{\boldsymbol{n}}_{\{ \cdot \} }}\left( {{\theta _{\{ \cdot \} }},{\phi _{\{ \cdot \} }}} \right) 头 — {{\boldsymbol{D}}_{\text{H}}}\left( {{D_{{\text{H}},{\text{x}}}},{D_{{\text{H}},{\text{y}}}},{D_{{\text{H}},{\text{z}}}}} \right) 颈 {L_{\text{N}}} {{\boldsymbol{D}}_{\text{N}}}\left( {{D_{{\text{N,1}}}},{D_{{\text{N}},2}}} \right) 肩 {L_{\text{S}}} {{\boldsymbol{D}}_{\text{S}}}\left( {{D_{{\text{S,1}}}},{D_{{\text{S}},2}}} \right) 身 {L_{\text{T}}} {{\boldsymbol{D}}_{\text{T}}}\left( {{D_{{\text{T,1}}}},{D_{{\text{T}},2}}} \right) 以椭球模拟人头时, 耳部并不位于椭球两侧的轴线上。本文假设双耳位置对称, 并引入耳道口直径
{D_{\text{E}}} , 耳道口x-z平面坐标{{\boldsymbol{u}}_{\text{E}}}\left( {{u_{{\text{E}},{x}}},{u_{{\text{E}},{\textit{z}}}}} \right) , 以及耳道口间距{L_{\text{E}}} 。构建人因参数几何模型的流程如图5所示。首先由深度相机扫描获得点云数据。需要指出, 绘制图5时使用的是Brare和Fels提供的点云数据 [26]。随后将点云数据分解成5个部分, 即头、耳、颈、肩和体。下一步, 使用椭球或者椭圆与各部分的点云进行拟合。具体而言, 以点云到椭球面或椭圆柱面的距离总和最小为优化目标, 通过粒子群优化算法(PSO)对几何参数和运动参数进行优化。进一步, 利用放样操作构建颈部、肩部以及体部的表面, 从而完成建模。
3. 几何模型所致的辨识误差
为考察人因参数几何模型(图6(a), 模型1)的模型误差, 使用不同的方法构建另外3个几何模型, 并对比边界元仿真的传递函数。这3个模型分别为: 椭球方盒模型(图6(b), 模型2)、无耳廓人体点云模型(图6(c), 模型3), 有耳廓人体点云模型(图6(d), 模型4)。其中, 模型1由图5所示的流程获得。模型2参照文献[27]构建。模型4则由真实点云数据构建, 作为基准模型[26]。模型3在模型4的基础上去除了耳部周围的点云, 并用光滑曲面填补空白区域。模型3旨在定量考察耳廓滤波对辨识误差的影响, 以便更好地理解模型失配的原因。
以相同的建模流程和约束条件分别对以上4个几何模型进行网格剖分[26] 。表3展示了各模型在COMSOL仿真中的网格数与自由度。通过该表可以发现, 模型1的网格数与自由度均少于模型2和3, 这是由于模型1的表面更加光滑连续。表3的结果说明模型1在计算成本上具有优势。由于模型4的耳廓具有复杂细微的弯折结构, 其网格数和自由度数高过其他模型一倍以上。
表 3 不同模型的计算复杂度模型 网格数 自由度 1 1130 5745 2 1529 7891 3 1424 7208 4 3626 15210 仿真中, 声源所处的方位角从0°变化至180°, 其与原点的距离
R 分别为343 mm和3000 mm, 如图7所示。其中声源均位于耳朵同侧的半圆周上, 声源频率为100~2500 Hz。为了突出差异, 计算模型1~3与基准模型4之间的频率响应函数差。其中频响幅度差绘制于图8, 频响相位差绘制于图9。图8(a)和图9(a)所对应的声源坐标半径
R=343~{\rm mm} , 图8(b)和图9(b)与R= 3000~{\rm mm} 对应。在图8和图9中, 500 Hz以下, 模型1与模型3的幅度与相位基本相同, 幅度差均小于1 dB, 相位差均小于π/12。模型2的相位差与幅度差较小, 但其与模型3之间存在较为明显的差异, 尤其是
R = 3000~{\rm mm} , 入射角度为180°时, 模型2的幅度差接近2 dB。这是由于模型2使用了方盒模拟肩部与躯干, 与真实人体平滑倾斜的肩部不同所致。这表明人因参数几何模型(模型1)能够更好地替代点云数据模型。另一方面, 模型2在图8(a)和图8(b)中的曲线差异显著, 这是由模型2与模型4之间的倏逝波的差异导致的。该差异主要由几何模型失配所致,这说明更准确的几何模型可提升倏逝波场的估计精度。与模型3相关的曲线反映了去除耳廓所导致的模型失配的情况。图9与图10中, 在ANC技术所关注的频段范围内(< 500 Hz), 模型3的频率响应函数差很小, 这表明去除耳廓几何并不会造成显著的模型失配。这也说明, 模型1没有引入耳廓的做法是合理的。
4. 预测模型的降噪性能
4.1 平均降噪量及其退化量
为展示预测模型对ANC系统降噪效果的影响, 对比不同几何模型下的平均降噪量(Mean Noise Reduction,
{R_{{\text{MNR}}}} )分布[28]。其中, ANC系统的传声器和次级源的布置如图10所示, 与文献[22]一致, 旨在模拟头枕式ANC应用场景。初级声源位于外接球半径为3000 mm的320面体的162个顶点处, 进行单点激励, 以此模拟扩散声场中声波从各角度均匀入射的情况 [29]; 再利用式(3)得到162个初级源激励下{R_{{\text{NR}}}} ; 进一步, 通过平均获得{R_{{\text{MNR}}}} 。在双耳所对应的x -y 平面内设置51\times 51的观测点, 绘制{R_{{\text{MNR}}}} 的分布。计算
{R_{{\text{NR}}}} 的过程中, 由模型4, 即基准模型所获得的传递函数矩阵作为{{\boldsymbol{P}}_{\{ \cdot \} }} 和{{\boldsymbol{G}}_{\{ \cdot \} }} , 再将图6所示四个模型所得的结果作为{{\boldsymbol{\widehat P}}_{\{ \cdot \} }} 和{{\boldsymbol{\widehat G}}_{\{ \cdot \} }} , 从而得到对应的{R_{{\text{MNR}}}} 。特别地, 当{{\boldsymbol{\widehat P}}_{\{ \cdot \} }} 和{{\boldsymbol{\widehat G}}_{\{ \cdot \} }} 由模型4提供时, 由于{\boldsymbol{P}}_{\{ \cdot \} } = {\boldsymbol{\widehat P}}_{\{ \cdot \} } 且{\boldsymbol{G}}_{\{ \cdot \} } = {\boldsymbol{\widehat G}}_{\{ \cdot \} } , 降噪系统处于理想状态, 其降噪量在耳部取得最大值。为展示四个模型在不同频率下的降噪量分布, 分析无量纲参数
k{L_{\text{E}}} = 0.25, 0.5, 1, 2时的系统响应, 其中,{L_{\text{E}}} 是特征长度, 设{L_{\text{E}}} = 133 mm, 为模型4中的双耳间距,k 是空气中的波数。k{L_{\text{E}}} 所对应的实际频率分别为102.6 Hz, 205.2 Hz, 410.5 Hz, 820.9 Hz。图11是模型4即理想状态下的
{R_{{\text{MNR}}}} 分布。由于考虑了人头的散射, 图11的结果与文献[22]中的图9不同。当k{L_{\text{E}}} = 0.25时, 静区({R_{{\text{MNR}}}} >10 dB, 如图中实线所示)几乎充满了整个观测平面, 说明RM技术在100 Hz频率附近能够实现全局降噪。当k{L_{\text{E}}} = 0.5时, 静区范围缩小, 此时如果没有运动跟踪系统, 降噪效果会随人头运动而产生明显的下降。当k{L_{\text{E}}} = 1时, 6 dB降噪区域(如图中虚线所示)仅限于耳部附近, 此时如果没有运动跟踪系统, 人耳处的噪声可能会随姿态改变而增加。当频率增加至k{L_{\text{E}}} = 2时, 图中难以找到{R_{{\text{MNR}}}} > 6 dB的区域。这是由于观测传声器与误差传声器的相干性减小所致, 可通过增加观测传声器或优化传声器排布进行改善。为了突出差异, 图12—图14以图11为基础, 分别绘制了模型1至模型3的平均
{R_{{\text{MNDR}}}} 退化量(Mean Degradation of Noise Reduction,{R_{{\text{MDNR}}}} )。其定义是:{R}_{\text{MNDR, }模型i}={R}_{\text{MNR, }模型4}\text{-}{R}_{\text{MNR, }模型i} , 其中i = 1, 2, 3。由图12—图14可以看出, 模型2的退化最为明显, 而模型1的{R_{{\text{MDNR}}}} 分布与模型3接近。这说明在不考虑耳廓的情况下, 人因参数几何模型能够准确地对ANC系统的信号通路进行建模, 并不会导致显著的系统性能退化。随着频率的增加, 空间中固定距离的两点的相干性降低[28-29]。这使得模型失配的影响因初级源的空间平均而消失, 造成图12—图14中{R_{{\text{MDNR}}}} 随k{L_{\text{E}}} 增加而趋于0。4.2 稳定性
收敛判据式(6)中
\widehat {\boldsymbol{G}}_{\text{e}}^{\text{H}}{\widehat {\boldsymbol{G}}_{\text{e}}} 正定, 其绝对值在本文各模型下远大于\widehat {\boldsymbol{G}}_{\text{e}}^{\text{H}}{\widehat {\boldsymbol{O}}_{{\text{Opt}}}}\Delta {{\boldsymbol{G}}_{\text{m}}} 。这使得3个模型下, 式(6)左侧的值十分接近。为了更有效地对比模型之间稳定性的差异, 定义RM技术的收敛判据因子为\widehat \lambda = \frac{{\min \left[ {{\text{eig}}\left( {\widehat {\boldsymbol{G}}_{\text{e}}^{\text{H}}{{\widehat {\boldsymbol{G}}}_{\text{e}}}} \right)} \right]}}{{\max \left\{ {{\mathrm{abs}}\left[ {{\text{eig}}\left( {\widehat {\boldsymbol{G}}_{\text{e}}^{\text{H}}{{\widehat {\boldsymbol{O}}}_{{\mathrm{Opt}}}}\Delta {{\widehat {\boldsymbol{G}}}_{\text{m}}}} \right)} \right]} \right\}}}{\text{ ,}} (8) 其中,
{\text{abs}} 代表对向量各元素取模,{\text{min}}[ {{\text{eig}}( {\widehat {\boldsymbol{G}}_{\text{e}}^{\text{H}}{{\widehat {\boldsymbol{G}}}_{\text{e}}}} )} ] 为非负实数。\widehat \lambda > 1 是式(6)成立的充分条件。由于\widehat \lambda 表达式中存在{\widehat{\boldsymbol{ O}}_{{\text{Opt}}}} , 使其受初级源的位置影响。为了排除该影响, 假设观测传声器与误差传声器之间的声场与理想扩散场相同, 则{\widehat {\boldsymbol{O}}_{{\text{Opt}}}} 近似为[29]{\widehat{{\boldsymbol{O}}}}_{扩散场}={\left\{\text{sinc}\left(k\left|{{\boldsymbol{r}}}_{\text{e},{i}}-{{\boldsymbol{r}}}_{\text{m},{j}}\right|\right)\right\}}_{{i},{j}}\text{ ,} (9) 其中,
{\widehat{{\boldsymbol{O}}}}_{扩散场} 为扩散场假设下传递函数矩阵的估计值,{{\boldsymbol{r}}_{{\text{e}},{{i}}}} 和{{\boldsymbol{r}}_{{\text{m}},{{j}}}} 分别代表第i 个误差传声器和第j 个观测传声器的坐标。由于声场中存在散射体,{\widehat{{\boldsymbol{O}}}}_{扩散场} 为{\widehat {\boldsymbol{O}}_{{\text{Opt}}}} 的估计值, 二者并不完全相等。图15展示了基于RM技术的ANC系统的收敛判据因子
\widehat \lambda 的频谱。其中, 以模型4的结果作为实际传递函数矩阵{{\boldsymbol{G}}_{\{ \cdot \} }} , 预测模型的传递函数矩阵{\widehat {\boldsymbol{G}}_{\{ \cdot \} }} 分别由模型1至模型3通过仿真得到。由图可知, 模型1所对应的\widehat \lambda 介于模型2和模型3之间, 且模型1的\widehat \lambda 高出模型2超过2倍。这表明基于模型1的系统比基于模型2的系统更稳定。另一方面, 虽然第3节中模型1与模型3的辨识误差接近, 但模型1的曲线低于模型3接近5倍。这是由式(8)取极值的操作放大了矩阵特征值的差异导致的。此外, 在250 Hz及其谐频处, 曲线出现了一系列尖峰。这可能是由{\widehat{{\boldsymbol{O}}}}_{扩散场} 表达式中sinc函数在相关频率中出现较小的值导致的。综上, 在RM技术中, 使用基于模型1 (人因参数几何模型)的预测模型能够保证ANC系统具有足够的稳定性(\widehat \lambda > 30 ), 优于模型2 (椭球方盒模型)。5. 声传递通路预测实验
在全消声室中开展了验证实验, 其100 Hz以上单频自由场半径为3.5 m。实验使用B&K 5128人工头作为被测对象; 自制的点声源作为次级源, 单元振膜直径为1英寸, 箱体直径为60 mm; 观测传声器和声源参考传声器的直径为1/2英寸, 型号为CRY333 (放大器型号为CRY507), 用于测量传递函数; 使用双耳传声器作为误差传声器, 型号为B&K 4101-B, 固定在耳道口处, 随头一起转动。实验布置如图16所示, 声源及传声器坐标由吊线标定后调整到预期坐标点处。扬声器与传声器的实物如图17所示, 均由直径为6 mm、长度为1 m的钢管固定在三脚架上, 以此减少支架对声波散射的影响。实验使用了B&K 3160产生激励信号并完成信号采集。
5.1 头部转动下的实验结果
对人工头的颈部进行角度标记, 依次在头部转动0°, 45°, 90°的情况下开展实验。使用时长为5 s的单频正弦信号激励, 以此获得实验数据。另一方面, 对人工头模型进行了边界元仿真。其中, 人工头的人因参数几何模型的各项参数由实测的方式获得。
实验与仿真结果如图18与19所示。其中, 图18为传递函数的归一化幅度谱, 图19为传递函数的相位谱。在计算传递函数时, 以声源参考传声器的频谱作为分母, 以观测传声器或左耳误差传声器的频谱作为分子。由于仿真中声源参考传声器与声源中心仅有20 mm的距离, 使得实验中测点与声源中心距离的相对误差较大, 导致原始幅度谱存在较为显著的相对误差。图18中假设100 Hz时实验与仿真的幅度一致, 图18(a)和图18(b)中实验原始结果的幅度分别乘以1.87和1.57作为幅度修正常数。图18(a)和图18(b)的幅度修正不同, 这可能是由于双耳传声器上加装了防风帽, 并与耳廓相接触, 使灵敏度发生变化所致。
由图18和图19可知, 边界元仿真与实验获得的传递函数十分相近。这表明人因参数几何模型的模型误差与边界元仿真的计算误差较小, 可以通过仿真准确预测实际的传递函数。此外还可以发现, 图18(b)和图19(b)中的曲线随转头角度而产生较为复杂的变化。这说明传递函数会随人体姿态变化而改变, 移动虚拟传感技术中应当考虑人头的转动。
5.2 神经网络预测对比
为了验证图2所提技术路线的可行性, 本文以转头角度为神经网络输入, 以传递函数的实部或虚部为输出, 使用贝叶斯正则化算法训练了神经网络。其中隐藏层为10层, 输出层为30层。训练集由仿真提供, 转头角度分别为0°, 30°, 45°, 60°, 90°。测试集的转头角度为22.5°。
实验与神经网络输出结果如图20和图21所示, 分别为归一化幅度谱和相位谱。在图20中, 实验结果使用了与图18相同的幅度修正常数。图20和图21中, 实验与仿真结果十分接近。图20(b)中, 700 Hz情况下实验结果的幅度接近0.25, 高于图18(b)中转头角度为0°和45°的情况, 然而图20(b)中神经网络依然能够给出准确的预测。综上所述, 神经网络在1000 Hz以下频段能够较为准确地生成传递函数。
6. 结论
针对人体姿态变化所导致的有源降噪性能退化问题, 提出了一种基于人因参数几何模型的声学通路辨识策略, 其能够准确地预测人体姿态改变情况下有源噪声控制系统的声学通路。该策略对人体尺寸和多维运动姿态进行量化, 通过仿真和神经网络预测声学通路的传递函数矩阵。仿真结果表明, 与椭球方盒模型相比, 人因参数几何模型具有更小的模型误差和更低的计算成本, 并在降噪效果与稳定性方面具有优势。实验与神经网络预测结果表明, 人体姿态变化会导致声学通路传递函数发生复杂变化, 而所提策略能够精准预测动态的传递函数, 有望解决由人体姿态变化所致的有源噪声控制系统模型失配问题, 具有实用价值。
-
表 1 运动参数及参数耦合约束
{{\boldsymbol{u}}_{\{ \cdot \} }} {{\boldsymbol{n}}_{\{ \cdot \} }}\left( {{\theta _{\{ \cdot \} }},{\phi _{\{ \cdot \} }}} \right) {{\boldsymbol{m}}_{\{ \cdot \} }}\left( {{\alpha _{\{ \cdot \} }},{\beta _{\{ \cdot \} }}} \right) {\gamma _{\{ \cdot \} }} 头 {{\boldsymbol{u}}_{\text{H}}} {\mathit{u}}_{\mathrm{H}} — {{\boldsymbol{m}}_{\text{H}}} {\gamma _{\text{H}}} 颈 {{\boldsymbol{u}}_{\text{N}}} = {{\boldsymbol{u}}_{\text{H}}} + {L_{\text{N}}}{{\boldsymbol{n}}_{\text{N}}}\left( {{\theta _{\text{N}}},{\phi _{\text{N}}}} \right) {{\boldsymbol{n}}_{\text{N}}} {{\boldsymbol{m}}_{\text{N}}} = {{\boldsymbol{n}}_{\text{N}}} {\gamma _{\text{N}}} = {\gamma _{\text{H}}} 肩 {{\boldsymbol{u}}_{\text{S}}} = {{\boldsymbol{u}}_{\text{N}}} + {L_{\text{S}}}{{\boldsymbol{n}}_{\text{S}}}\left( {{\theta _{\text{S}}},{\phi _{\text{S}}}} \right) {{\boldsymbol{n}}_{\text{S}}} = {{\boldsymbol{n}}_{\text{N}}} {{\boldsymbol{m}}_{\text{S}}} = {{\boldsymbol{n}}_{\text{S}}} {\gamma _{\text{S}}} 身 {{\boldsymbol{u}}_{\text{T}}} = {{\boldsymbol{u}}_{\text{S}}} + {L_{\text{T}}}{{\boldsymbol{n}}_{\text{T}}}\left( {{\theta _{\text{T}}},{\phi _{\text{T}}}} \right) {{\boldsymbol{n}}_{\text{T}}} {{\boldsymbol{m}}_{\text{T}}} = {{\boldsymbol{n}}_{\text{T}}} {\gamma _{\text{T}}} = {\gamma _{\text{S}}} 表 2 几何参数约束
{L_{\{ \cdot \} }} {{\boldsymbol{n}}_{\{ \cdot \} }}\left( {{\theta _{\{ \cdot \} }},{\phi _{\{ \cdot \} }}} \right) 头 — {{\boldsymbol{D}}_{\text{H}}}\left( {{D_{{\text{H}},{\text{x}}}},{D_{{\text{H}},{\text{y}}}},{D_{{\text{H}},{\text{z}}}}} \right) 颈 {L_{\text{N}}} {{\boldsymbol{D}}_{\text{N}}}\left( {{D_{{\text{N,1}}}},{D_{{\text{N}},2}}} \right) 肩 {L_{\text{S}}} {{\boldsymbol{D}}_{\text{S}}}\left( {{D_{{\text{S,1}}}},{D_{{\text{S}},2}}} \right) 身 {L_{\text{T}}} {{\boldsymbol{D}}_{\text{T}}}\left( {{D_{{\text{T,1}}}},{D_{{\text{T}},2}}} \right) 表 3 不同模型的计算复杂度
模型 网格数 自由度 1 1130 5745 2 1529 7891 3 1424 7208 4 3626 15210 -
[1] Price G R. Implications of a critical level in the ear for assessment of noise hazard at high intensities. J. Acoust. Soc. Am., 1981; 69(1): 171−177 DOI: 10.1121/1.385361
[2] Taborda R F, Gomes R F, Rocha C H, et al. Evaluation of noise reduction interventions in a school. Folia. Phoniatr. Logop., 2021; 73(5): 367−375 DOI: 10.1159/000509332
[3] 赵剑, 徐健, 李晓东, 等. 有源抗噪声护耳器 H 2 /H ∞ 优化方法研究. 声学学报, 2007; 32(5): 447−453 DOI: 10.15949/j.cnki.0371-0025.2007.05.005 [4] 邹海山, 邱小军. 复杂声学环境中人耳附近空间有源降噪研究综述. 物理学报, 2019; 68(5): 1−18 DOI: 10.7498/aps.68.20182123 [5] Lu L, Yin K L, de Lamare R C. A survey on active noise control in the past decade—Part I: Linear systems. Signal Process., 2021; 183: 1−22 DOI: 10.1016/j.sigpro.2021.108039
[6] 肖椽生, 徐健, 李晓东. 虚拟传声器在有源抗噪声护听器的应用. 声学学报, 2010; 35(2): 140−145 DOI: 10.15949/j.cnki.0371-0025.2010.02.016 [7] Moreau D J, Cazzolato B S, Zander A C, et al. A review of virtual sensing algorithms for active noise control. Algorithms, 2008; 1(2): 69−99 DOI: 10.3390/a1020069
[8] Elliott S J, David A. A virtual microphone arrangement for local active sound control. International Conference on Motion and Vibration Control, Yokohama, 1992: 1027−1031
[9] 邹海山, 邱小军. 人头散射对虚拟声屏障的性能影响分析. 声学学报, 2007; 32(6): 481−488 DOI: 10.15949/j.cnki.0371-0025.2007.06.001 [10] Behera S K, Das D P, Subudhi B. Head movement immune active noise control with head mounted moving microphones. J. Acoust. Soc. Am., 2017; 142(2): 573−587 DOI: 10.1121/1.4996125
[11] Miyake T, Iwai K, Kajikawa Y. Head-mounted multi-channel feedforward active noise control system for reducing noise arriving from various directions. IEEE Access, 2023; 11: 6935−6943 DOI: 10.1109/ACCESS.2023.3237812
[12] Lei C Y, Xu J, Wang J, et al. Active headrest with robust performance against head movement. J. Low Freq. Noise V. A., 2015; 34(3): 233−250 DOI: 10.1260/0263-0923.34.3.233
[13] Moreau D J, Cazzolato B S, Zander A C. Active noise control at a moving virtual microphone using the SOTDF moving virtual sensing method. Proceedings of Acoustics, Australian Acoustical Society, Adelaide, Australia, 2009
[14] Zhang Z Q, Wu M, Yin L, et al. Robust feedback controller combined with the remote microphone method for broadband active noise control in headrest. Appl. Acoust., 2022; 195: 1−10 DOI: 10.1016/j.apacoust.2022.108815
[15] Jung W, Elliott S J, Cheer J. Combining the remote microphone technique with head-tracking for local active sound control. J. Acoust. Soc. Am., 2017; 142(1): 298−307 DOI: 10.1121/1.4994292
[16] Rafaely B, Elliott S J, Garcia-Bonito J. Broadband performance of an active headrest. J. Acoust. Soc. Am., 1999; 106(2): 787−793 DOI: 10.1121/1.427134
[17] Petersen C D, Zander A C, Cazzolato B S, et al. A moving zone of quiet for narrowband noise in a one-dimensional duct using virtual sensing. J. Acoust. Soc. Am., 2007; 121(3): 1459−1470 DOI: 10.1121/1.2431583
[18] Brare H S, Fels J. Towards child-appropriate virtual acoustic environments: a database of high-resolution HRTF measurements and 3D-scans of children. Int. J. Environ. Res. Public Health, 2022; 19(1): 1−17 DOI: 10.3390/ijerph19010324
[19] O’Sullivan E, Zafeiriou S. 3D landmark localization in point clouds for the human ear. 15th IEEE International Conference on Automatic Face and Gesture Recognition, Buenos Aires, Argentina, 2020: 402−406
[20] Carraro M, Munaro M, Menegatti E. Skeleton estimation and tracking by means of depth data fusion from depth camera networks. Rob. Auton. Syst., 2018; 110: 151−159 DOI: 10.1016/j.robot.2018.09.009
[21] Chang C Y, Chuang C T, Kuo S M, et al. Multi-functional active noise control system on headrest of airplane seat. Mech. Syst. Signal Process., 2022; 167: 1−16 DOI: 10.1016/j.ymssp.2021.108552
[22] Zhang J, Elliott S J, Cheer J. Robust performance of virtual sensing methods for active noise control. Mech. Syst. Signal Process., 2021; 152: 1−16 DOI: 10.1016/j.ymssp.2020.107453
[23] Feuer A, Weinstein E. Convergence analysis of LMS filters with uncorrelated gaussian data. IEEE Trans. Acoust. Speech Signal Process., 1985; 33(1): 222−230 DOI: 10.1109/TASSP.1985.1164493
[24] Becker S, Berger J, Ludwig O, et al. Heading in soccer: does kinematics of the head-neck-torso alignment influence head acceleration. J. Hum. Kinet., 2021; 77: 71−80 DOI: 10.2478/hukin-2021-0012
[25] Burkhard M D, Sachs R M. Anthropometric manikin for acoustic research. J. Acoust. Soc. Am., 1975; 58(1): 214−222 DOI: 10.1121/1.380648
[26] COMSOL. Head and torso HRTF computation. [2023]. https://cn.comsol.com/model/head-and-torso-hrtf-computation-75011
[27] Cai T L, Rakerd B, Hartmann W M. Computing interaural differences through finite element modeling of idealized human heads. J. Acoust. Soc. Am., 2015; 138(3): 1549−1560 DOI: 10.1121/1.4927491
[28] Elliott S J, Cheer J. Modeling local active sound control with remote sensors in spatially random pressure fields. J. Acoust. Soc. Am., 2015; 137(4): 1936−1946 DOI: 10.1121/1.4916274
[29] Cook R K, Waterhouse R V, Berendt R D, et al. Measurement of correlation coefficients in reverberant sound fields. J. Acoust. Soc. Am., 1955; 27(6): 1072−1077 DOI: 10.1121/1.1908122