Direction finding characteristics of the bionic sonar model of a big brown bat
-
摘要:
采用计算机仿真建立了蝙蝠生物声呐的仿生模型, 并研究了其测向性能。基于双耳干涉谱建立了模拟蝙蝠方位感知的双耳宽带干涉仪模型, 结合卷积神经网络(CNN)实现了方位特征的提取与感知, 同时阐述了该模型多频点解模糊的原理。仿真结果表明, 当信噪比为25 dB时, 所提仿生模型在粗略搜索模式下测向精度为0.87°, 在精确搜索模式下测向精度为0.116°, 获得了较高的方位识别精度, 且具有解模糊能力。与采用宽带相位差计算目标方位信息的方法相比, 所提模型具有相近的测向性能, 但解模糊能力更强。
Abstract:A bionic model of bat bio-sonar is established through computer simulation in this study, with a focus on investigating its orientation measurement performance. A model for simulating bat orientation perception is created via a binaural broadband interferometer, utilizing binaural interference spectra. The model incorporates a convolutional neural network (CNN) to achieve extraction and perception of orientation features. Additionally, the principle of multi-frequency point defuzzification is elaborated upon in the model. The simulation results reveal the proposed bionic model achieves a direction measurement accuracy of 0.74° and 0.116° in the rough search mode and precise search mode, respectively, at a signal-to-noise ratio of 25 dB. The model demonstrates high accuracy in orientation recognition and defuzzification capability. Compared to the technique that employs broad phase difference to determine target orientation information, the proposed model exhibits analogous direction finding efficiency but superior defuzzification capacity.
-
引言
部分具有回声定位功能的蝙蝠通过嘴巴或鼻叶发射超声波信号, 根据双耳接收回波信号携带的信息即可判断出猎物的类别或环境的特征[1]。对蝙蝠生物声呐回声定位能力的研究是生物学研究的重要课题[2]。蝙蝠生物声呐的回声定位可以实现目标的距离、方位、速度等信息感知以及环境场景识别等[3,4]。鉴于蝙蝠回声定位能力的优越性, 多篇文献开展了关于蝙蝠生物声呐测向、测距等功能的仿生研究。文献[5]制作了普氏蹄蝠仿生双耳超声波接收装置, 并利用双耳接收信号的时频图和残差神经网络实现了目标的测向功能。文献[6]模拟蝙蝠耳朵高速抖动实现声源测向的原理, 提出了一种单传感器结合深度学习网络的目标方位估计方法, 可以实现单传感器测向。文献[7]利用仿生声呐收集了不同方向和频率的回声信号的振幅时间序列, 使用差分熵分析了这些数据。研究表明信号沿时间维度的信息与沿频率维度相似, 但少于方向维度。文献[8]建立了蝙蝠生物声呐的实验模型, 以模拟耳廓和鼻叶对生物声呐性能的影响。Simmons等提出了一种经典的谱相关与变换(SCAT)模型, 用于分析回声定位系统的距离测量精度与距离分辨力 [9-10]。该模型的建立考虑了蝙蝠发射宽带信号的神经学机理和听觉神经组织的构成特点, 可较好地解释蝙蝠在距离维的超分辨能力。
尽管回声定位系统测距的仿生研究取得了一定进展, 但对于测向机理的研究相对较少。文献[11]根据信号的稀疏处理理论建立了距离−方位联合字典, 根据该字典的对应关系即可求解目标的距离和方位信息。但是该方法仅通过仿真的方式进行了分析, 没有相关文献证明蝙蝠生物声呐采用联合字典进行测距测向。文献[12]设计了一对蝙蝠仿生耳廓模型, 利用该模型只需两个独立的单输出神经网络即可同时实现俯仰角与方位角的估计。现有文献表明, 蝙蝠能区分±1.5°的目标方位[13], 但对蝙蝠生物声呐测向机理的深入分析较为缺乏。因此, 本文针对蝙蝠回声定位系统的测向功能进行建模仿真, 探讨具有测向能力的蝙蝠生物声呐仿生模型的建立方法。文中基于干涉仪原理进行双耳方位感知仿生建模。窄带干涉仪测向机理在无线电领域中已成功应用[14-15], 考虑到大棕蝠所发射的多谐波宽带信号[16], 针对蝙蝠生物声呐建立一种宽带干涉仪模型。
随着人工智能技术的不断发展, 目前已有文献使用卷积神经网络或其他人工智能算法实现阵列的波达方向(DOA)估计[17-18]。卷积神经网络作为一种经典的深度学习算法[19], 能够模拟多神经元的感知与特征提取过程[20], 对蝙蝠生物声呐仿生建模具有借鉴意义。因此, 本文在建立模拟蝙蝠方位感知的双耳宽带干涉仪数学模型基础上, 结合卷积神经网络提取输出信号的时频干涉谱特征, 实现了对蝙蝠方位感知功能的模拟。
1. 蝙蝠生物声呐仿生模型
以经典的大棕蝠信号为例, 分析了蝙蝠的发射信号模型与宽带回波模型, 建立了基于宽带干涉仪的蝙蝠生物声呐仿生模型, 结合卷积神经网络, 实现生物声呐的方位感知能力。
1.1 蝙蝠发射信号及目标回波模型
生物学研究表明, 蝙蝠的发射信号主要分为三种: 宽带调频信号、长恒频−调频信号以及短恒频−调频信号[21]。其中, 大棕蝠发射的信号为宽带多谐波调频信号[22], 其基波扫频范围为60~20 kHz; 二次谐波扫频范围为90~50 kHz; 三次谐波扫频范围为110~70 kHz。采用对数时间模型对大棕蝠发射的三谐波下扫频信号进行表示[23], 其频率为
fi(t)=Fnln[(t−t0)/L0]+fe, (1) 式中, i = 1, 2, 3, 表示谐波次数。t表示时间,
fe 为截止频率, Fn为频率衰减常数, 时间渐近线t0为−0.05, L0 取值 0.05。fi(t)为信号瞬时频率, 后续简写为fi。大棕蝠的发射信号可表示为s(t)=3∑i=1Ai(t)exp[j2πfit+φi], (2) 式中, Ai(t)为信号的时变振幅, φi 表示每个谐波的初始相位, i = 1, 2, 3 分别为信号的谐波编号。由于大棕蝠发声的鼻叶和接收超声波的耳朵均具有指向性, 因此本文设置了发射与接收指向性函数, 用于模拟蝙蝠发声鼻叶和耳朵的方向性。鼻叶与耳朵的方向图分别如图1(a)(b)所示, 鼻叶和耳朵的指向性函数为
P(ζ) ,Q(ζ) , 其中ζ 为散射点的角度, 具体指代为两耳连线的法线与目标的夹角[24]。将大棕蝠第m个脉冲信号表示为
sT(m,t)=P(ζ)3∑i=1rect(t−m⌢Tm˜Tm)Ai,m(t)⋅exp{j[2πfi(t−m⌢Tm)+φi,m]}, (3) 式中, Ai,m(t)和φi,m 分别为第i个谐波第m个脉冲的时变幅度和初始相位,
˜Tm 为脉冲宽度,⌢Tm 为脉冲重复周期,rect(⋅) 表示标准矩形脉冲函数:rect(ξ)={1,0⩽ (4) 对大棕蝠信号进行 512 点的短时傅里叶变换(STFT), 得到图2(a)所示三维时频图与图2(b)所示俯视时频图。
根据蝙蝠捕猎目标的场景, 建立如下目标回波模型。考虑目标与蝙蝠在t时刻的距离为
r(t) = D_0 + v_t t , D0为t = 0 时刻二者之间的初始距离。假设目标相对于蝙蝠的径向速度为vt (远离蝙蝠方向为正), 发射信号时刻为t, 则目标回声时延\tau 可表示为[25]\tau = \frac{{2({D_0} + v_tt)}}{{v_s + v_t}} , (5) 式中, vs为声速。
第m个脉冲的目标回波为
\begin{split} x(m,t) =& P (\zeta )Q (\zeta ){\epsilon _i}{s_T}(m,t - \tau )= \\& P (\zeta )Q (\zeta )\sum\limits_{i = 1}^3 {\epsilon _i}{\mathrm{rect}}\left(\frac{{t - \tau - m{\widehat{T}_m}}}{{{\widetilde{T}_m}}}\right)\cdot\\&{A_{i,m}}(t)\exp \{{\text{j}}[2{\text{π }}{f_i}(t - \tau - m{\widehat{T}_m})+\varphi_{i,m}]\} , \end{split} (6) 式中,
{\epsilon _i} 为第i个谐波的散射系数。将式(5)代入式(6), 并令{\eta _i}(t,\tau ) = {\epsilon_i}{\mathrm{rect}}\left(\frac{{t - \tau - m{\widehat{T}_m}}}{{{\widetilde{T}_m}}}\right){A_{i,m}}(t) , (7) \psi (\zeta ) = P (\zeta )Q (\zeta ) , (8) 可得
\begin{split} x(m,t) = {}& \psi (\zeta )\sum\limits_{i = 1}^3 {\eta _i}(t,\tau )\exp \Bigg\{\mathrm{j}\Bigg[{{2\pi }}{f_i}(t - \frac{{2({D_0} + v_tt)}}{{v_s + v_t}} - m{\widehat{T}_m})+\\& \varphi_{i,m}\Bigg]\Bigg\}= \psi (\zeta )\sum\limits_{i = 1}^3 {\eta _i}(t,\tau )\exp \left[{{j2\pi }}{f_i}(t - m{\widehat{T}_m})\right]\cdot \\& \exp \left[{{ - {\mathrm{j}}2\pi }}{f_i}\frac{{2{D_0}}}{{v_s +v_t}}\right]\exp \left[{{ - {\mathrm{j}}4\pi }}{f_i}\frac{v_t}{{v_s + v_t}}t\right]\exp \left[\mathrm{j}\varphi_{i,m}\right] .\end{split} (9) 式(9)中
{\eta _i} 为时变包络, 不含相位信息。回波信息主要为4个相位项, 第1项表示多脉冲多谐波相位项, 第2项表示多谐波距离D0相位项, 第3项为速度相位项, 第 4 项为不同载波频率不同脉冲的初相位。由于多普勒频率{f_d} = 2v_t{f_i}/(v_s + v_t) , 所以不同频率的载波信号具有不同的多普勒频率。对于单脉冲发射, 回声信号可简化为\begin{split} x(t) = & \psi (\zeta )\sum\limits_{i = 1}^3 {\eta _i}(t,\tau )\exp [{{{\rm j}2\pi }}{f_i}t]\cdot \\& \exp \left[{{{\rm j}2\pi }}{f_i}\frac{{2{D_0}}}{{v_s + v_t}}\right]\exp \left[{{{\rm j}2\pi }}{f_i}\frac{{ - 2v_t}}{{v_s +v_t}}t\right]\exp \left[\mathrm{j}\varphi_{i,m}\right] , \end{split} (10) 其中, 相位项
\exp [{{{\mathrm{j}}2\pi }}{f_i}2{D_0}/(v_s + v_t)] 不含t项, 故简写为D({f_i}) 。1.2 蝙蝠生物声呐测向仿生模型
蝙蝠的双耳测向感知机理如图3所示。蝙蝠双耳可以感知回波信号中不同频率分量随时间的变化情况, 利用时频分析方法对频率分量及时延进行量化表示, 可以在一定程度上模拟蝙蝠的听觉系统。
基于干涉仪原理模拟蝙蝠生物声呐的双耳测向模型。由于蝙蝠发射信号为宽带信号, 故将窄带干涉仪推广至宽带范畴, 建立适用于蝙蝠方位感知的宽带干涉仪数学模型。为了模拟蝙蝠的方位感知能力, 采用卷积神经网络实现蝙蝠双耳信号方位特征提取。建立的具有方位感知能力的蝙蝠生物声呐仿生模型原理框图如图4所示。首先对蝙蝠双耳接收信号进行短时傅里叶变换, 得到干涉谱时频平面。时频平面经过二值化、尺寸变换等预处理, 得到二值化特征平面。特征平面的数学形式为二维数据矩阵, 作为CNN网络的输入, 网络的输出为角度分类结果。
蝙蝠利用大脑中不同区域的神经元感知回声方位的时间差、强度差和频率差, 尤其是对频率信息非常敏感[26]。通过捕捉频谱中不同频率能量的细微差异, 即可实现灵敏的方位感知, 这也是图4采用的仿生机理。人工智能领域早期引入人工神经网络的动机即是对生物神经元进行模拟, 且卷积神经网络对神经元的模拟非常成功。卷积神经网络的局部感受野、共享权值和汇聚对应于生物神经元的不同处理功能和特性。因此, 利用宽带干涉仪原理得到回波信号的宽带特征后, 结合卷积神经网络的感知功能, 可以实现对回声定位系统测向功能的模拟。
来自不同方位的目标回声信号干涉谱存在纹理差异, 卷积神经网络可提取该种特征从而实现目标回声的角度感知。生物声呐测向模型主要包括以下几个部分: 基于宽带干涉仪模型的蝙蝠双耳信号接收; 对双耳接收信号进行时频分析, 得到双耳干涉谱特征; 预处理后, 将双耳干涉谱特征作为卷积神经网络的输入, 其输出为不同角度的分类结果。
1.2.1 蝙蝠双耳接收信号分析
基于宽带干涉仪模型分析蝙蝠双耳接收信号。假设双耳间隔为
L , 两耳连线的法线与目标的夹角为\zeta , 则双耳接收信号时延[27]为\delta = \frac{{L\sin \zeta }}{v_s} . (11) 根据式(9), 双耳接收信号分别为
\begin{split} {x_1}(t) ={}& \psi (\zeta )\sum\limits_{i = 1}^3 \eta_i (t,\tau )D({f_i})\exp \left[{{{\mathrm{j}}2\pi }}{f_i}t\right]\cdot\\& \exp \left[{{ - {\mathrm{j}}4\pi }}{f_i}\frac{v_t}{{v_s + v_t}}t\right] , \end{split} (12) \begin{split} {x_2}(t,\delta ) =& \psi (\zeta )\sum\limits_{i = 1}^3 \eta_i (t,\tau )D({f_i})\exp [{\text{j}}2\pi {f_i}(t - \delta )]\cdot \\&\exp \left[ - {{{\mathrm{j}}4\pi }}{f_i}\frac{v_t}{{v_s + v_t}}(t - \delta )\right] =\\& {x_1}(t)\sum\limits_{i = 1}^3 \exp \left[ - {{{\mathrm{j}}2\pi }}{f_i}\frac{{v_s - v_t}}{{v_s + v_t}}\delta \right] . \end{split} (13) 采用λi表示谐波波长, 令
{\phi _{{f_i}}} = - 2\pi {f_i}\frac{{v_s - v_t}}{{v_s + v_t}}\delta = - 2\pi \frac{{(v_s - v_t)}L\sin\zeta}{{(v_s + v_t)}\lambda_i}. (14) 由该式可知, 相位的变化与双耳距离、谐波波长、目标相对于蝙蝠的径向速度以及目标相对蝙蝠的角度相关。对两耳接收信号求和:
y(t) = {x_1}(t) + {x_2}(t) , (15) 即为蝙蝠所听信号的双耳干涉。双耳干涉信号的频谱可视为对 3 个谐波分别进行傅里叶变换求和得到, 即
\begin{split} Y({\text{j}}{\omega})={}& \sum\limits_{i = 1}^3 Y({\text{j}}{\omega _i}) = \sum\limits_{i = 1}^3 {X}({\text{j}}{\omega _i})[1 + \exp ({\text{j}}{\phi _{{f_i}}})]=\\& \sum\limits_{i = 1}^3\psi(\zeta)\widetilde{X}({\text{j}}{\omega _i})[1 + \exp ({\text{j}}{\phi _{{f_i}}})], \end{split} (16) 式中, i = 1, 2, 3;
{X}({\text{j}}\omega_i) 表示x_1 (t) 第 i 谐波的傅里叶变换频谱形式,{\widetilde X}({\text{j}}\omega_i) 表示不含鼻叶与耳朵方位项的x_1 (t) 第 i 谐波的傅里叶变换频谱形式,{Y}({\text{j}}\omega_i) 表示双耳叠加信号第 i 谐波的傅里叶变换频谱形式。可知, 随着目标角度的变化, 干涉信号频谱幅度的变化受到鼻叶与耳朵方向性函数调制的变化; 从相位的角度观察干涉信号谱, 对基波变换得到的频谱而言, 当{\phi _{{f_1}}} = {\text{π}} + 2k{\text{π}} ,~ k=0, 1, \cdots 时, 会出现谱零点; 同理, 对二次谐波变换、三次谐波变换得到的频谱而言, 当{\phi _{{f_2}}} = {\text{π}} + 2k{\text{π}},~ {\phi _{{f_3}}} = {\text{π }} + 2k{\text{π }},~ k = 0, 1, \cdots 时, 会出现谱零点。观察式(14), 在时间为毫秒量级时, 目标速度保持不变, 即(v_s - v_t)/(v_s + v_t) 为常数。时延\delta 会随着角度\zeta 发生变化, 谐波频率f_i 的范围为20~110 kHz, 则\phi_{f_i} 随着双耳接收信号时延而变化。因此角度不同时, 会出现不同的谱零点。1.2.2 方位特征提取
基于干涉谱获取目标的方位信息。采用STFT对双耳信号进行时频分析得到时频谱。该三维谱图是一张灰度图片, 对应一个二维的数据矩阵, 矩阵中的元素对应干涉谱的幅度信息, 幅度的大小对应不同的灰度。以目标位于−55°时的时频图为例, 观察角度与时频图变化的关系, 如图5所示。处理时频干涉谱图对应的二维数据矩阵。设定阈值门限, 将矩阵中大于门限的数据量化为255, 小于门限的量化为0, 从而得到一个二值化黑白图片。该操作即为图像二值化。将图像输入神经网络之前还需要按照所需尺寸进行缩放, 即几何变换, 最终得到时频干涉谱特征图的像素尺寸为112×112。图6为目标位于−55°, 11°, −30°, 68°的特征图。双耳干涉谱各谐波的起伏随目标角度的变化而变化, 该起伏可作为神经网络对方位进行分辨的特征使用。
1.2.3 实现方位感知的卷积神经网络
采用一种较Le-Net5 更为简化的5层卷积神经网络实现方位感知模拟, 其5层网络分别为输入层、卷积层、池化层、全连接层和输出层。卷积神经网络模型训练测试过程和每层的参数设置如图7所示。输入矩阵数据尺寸为112 × 112的二值化时频干涉谱特征。在模型的训练过程中, 首先对卷积神经网络的权重以及偏置参数进行初始化操作, 再将特征图作为训练集输入至神经网络, 并对其进行前向传播运算。接着经过卷积、池化、全连接等网络层后, 将在输出层得到目标方向的预测值。将输出层的预测值与实际值进行对比得出损失, 将该损失进行反向传播, 进而更新各层的权重和偏置, 通过这种调整模型参数的方式来达到最小化损失的目的。循环迭代, 直到满足卷积神经网络代价函数的收敛条件。在模型的测试过程中, 将干涉谱特征图作为测试集输入, 利用更新完成的权重和偏置来进行目标角度的分类。此处卷积核的尺寸大小与传统的网络不同, 传统的网络卷积核大小基本为4 × 4或5 × 5, 卷积核按照方块滑动提取特征无法同时感知多谐波特性; 此处卷积核大小设置为112 × 5, 直接对特征图的一列数据进行平移。该种卷积核能够同时提取所有谐波信号特征, 有利于提高识别准确率。卷积核个数设为6个, 输入特征的像素尺寸为112 × 112, 卷积核的尺寸为112 × 5。将卷积核与特征进行卷积, 根据卷积核内不同元素值, 提取输入的不同特征, 得到6个特征, 像素尺寸为1 × 108。采用均值池化对6个特征进行下采样, 实现图像压缩, 提取主要特征。池化区域大小为1 × 2, 池化层输出6个像素尺寸为1 × 54的特征。将池化后输出6个特征的每个像素依次展开连接, 排成一列, 利用sigmoid函数将实值映射到0和1之间, 利用softmax分类器得到最终输出。
卷积神经网络的训练样本的间隔为1°, 预设角度范围为−90°~+90°。采用相同的样本间隔, 设置测试样本的角度范围为−90.5°~+90.5°, 分别生成181个训练样本和181个测试样本。为了评估模型的训练状态, 将训练集和测试集以相差0.5°的方式进行了设置。测试集即为模型所要正确预测的角度类别, 若模型预测的结果与测试集中真实的角度一致, 则代表模型的预测结果正确, 即分类正确, 反之则为分类错误的情况。
2. 仿生模型性能分析
通过计算机仿真分析仿生模型的测向精度、误差与信噪比关系、解模糊机理等。
2.1 测向性能与信噪比的关系
对比不同信噪比条件, 分析该仿生模型的测向性能。仿真参数设置如下: 蝙蝠发射信号频率范围为20~110 kHz, 蝙蝠双耳距离L = 0.01 m, 声速vs = 340 m/s, 采样频率Fs= 400 kHz, 蝙蝠发射信号脉宽为3 ms, 带宽为90 kHz, 发射脉冲数为6, 发射脉冲重复周期为120 ms。以时频干涉谱图作为卷积神经网络的输入, 其网络参数与1.2.3节一致, 信噪比范围为10~35 dB, 进行3000次迭代训练。蝙蝠生物声呐仿生模型不同信噪比的测向性能如图8和图9所示。 图8是信噪比在10 dB, 20 dB, 30 dB的条件下, 神经网络输出的判决角度值与实际角度值之间的均方根误差(RMSE)关系。可知测向误差会随着信噪比的增大而明显减小。图9给出了方位估计值均方根误差与信噪比的关系。由图可知, RMSE随着信噪比的增大而减小。RMSE在信噪比为25 dB时为0.87°, 与信噪比为10 dB时相比, 该值下降了0.74°。这表明本文所建立的蝙蝠生物声呐仿生模型具有较高的测向精度, 且随信噪比的增大性能有所提升。
2.2 测向精度分析
训练样本和测试样本之间的差异性会影响蝙蝠生物声呐的目标角度分类精度。鉴于蝙蝠首先采用粗略搜索的方法寻找目标, 然后再采用精确搜索的方式进行确认目标, 本节将训练样本和测试样本的角度设置为0.1°的间隔, 以更精确的角度分类精度来验证测向精度。训练集的样本间隔设置为0.1°, 目标角度范围为−10°~10°, 采用相同的样本间隔, 设置测试样本的目标角度范围为−10.05°~9.95°, 分别生成201个训练样本和201个测试样本。信噪比为25 dB, 其他参数见2.1节, 进行5000次迭代训练。不同目标角度的识别误差如图10所示, 此时的均方根误差为0.116°, 与1°间隔样本时相比, 该仿生模型的测向精度有所提高。
2.3 蝙蝠生物声呐仿生模型与常规宽带干涉仪测向模型精度比较
通过计算机仿真对比分析蝙蝠生物声呐仿生模型(BMBBS)与基于相位差的干涉仪人工测向算法(DFAIM) (见附录A式(A1))的性能差异。蝙蝠生物声呐仿生模型即1.2节所建立的模型。仿真参数如1.2.3节所示。训练样本方位角度取每1°为一个格点, 即−90°, −89°, …, 90°, 故理论测向精度为±0.5°。随机选定5个测试样本, 目标角度分别设置为−48.45°, −21.25°, −1.15°, 13.25°, 38.35°, 信噪比30 dB。基于相位差的干涉仪人工测向算法执行200次蒙特卡罗仿真, 求取均值作为目标角度的测量值, 对5个不同角度的测量值计算其均方根误差。蝙蝠生物声呐仿生模型同样重复200次实验, 求取均值计算均方根误差。经仿真实验, 蝙蝠生物声呐仿生模型对目标角度均可正确分类, 如表1所示。由于训练样本获得的分类角度为整数, 所以测试阶段神经网络输出方位均为整数值。蝙蝠生物声呐仿生模型的角度均方根误差为0.3074°, 基于相位差的干涉仪人工测向算法的角度均方根误差为0.0021°。可见, 干涉仪人工测向算法的测向精度高于蝙蝠生物声呐仿生模型, 而本文模型的优势在于其测向方法具有解模糊能力。测试样本目标角度的取值靠近格点或远离格点, 会带来均方根误差较为明显的变化。
表 1 不同模型性能对比目标角度 (°) −48.45 −21.25 −1.15 13.25 38.35 误差均方根 (°) BMBBS 测得角度 (°) −48 −21 −1 13 38 — 误差 (°) 0.45 0.25 0.15 −0.25 −0.35 0.3074 DFAIM 测得角度 (°) −48.4512 −21.2511 −1.1476 13.2483 38.3468 — 误差 (°) −0.0012 −0.0011 0.0024 −0.0017 −0.0032 0.0021 2.4 测向解模糊机理分析
本文假设蝙蝠双耳之间的距离为0.01 m, 当蝙蝠发射30 kHz低频段信号时, 可计算出对应的半波长为0.0056 m, 小于蝙蝠双耳之间的距离, 当发射110 kHz高频段时, 可计算出对应的半波长为0.0015 m, 同样小于蝙蝠双耳之间的距离。根据干涉仪的工作原理可知在高频段和低频段均存在测向模糊问题。鉴于此, 本文采用CNN来感知蝙蝠双耳间的干涉谱特征进行测向能够解决方位模糊问题。此外, 干涉仪人工测向方法利用单频点进行相位计算时, 也存在测向模糊问题, 因此需根据附录A的方法计算多个频点的相位差来进行解模糊。
尽管利用卷积神经网络的仿生模型测向精度低于干涉仪人工测向算法, 但该模型能有效地避免角度估计的模糊问题。因此, 基于干涉仪人工测向的算法并不能等效于蝙蝠生物声呐测向。
3. 结论
本文提出了一种结合宽带干涉仪测向原理与卷积神经网络的蝙蝠生物声呐仿生模型, 通过计算机仿真分析了蝙蝠生物声呐回声定位的测向性能。考虑蝙蝠具有粗略搜索模式和精确搜索模式的捕食策略, 对基于双耳接收信号的时频干涉谱图进行划分, 结合卷积神经网络, 分析了不同方位分辨条件下的测向性能。仿真结果表明所提模型具有较高的测向分辨能力, 且能有效避免宽带干涉仪测向的角度模糊问题。该模型可为仿生声呐在测向领域的应用提供参考。
附录A 宽带干涉仪模型的测向解模糊机理分析
图A1为DFAIM算法测向原理图。设蝙蝠左右耳之间的距离为 L, 来波波长为λ, 目标与双耳连线的法线对应的夹角记为
\zeta 。在该模型中, 双耳接收到的回声相位差为\phi = \frac{{2{\text{π }}}}{\lambda }L\sin \zeta . \tag{A1} 将式(A1)进行反正弦运算可得到目标方位角度为
\zeta = {\text{arcsin}} \frac{ \phi \lambda}{ 2{\text{π}}L},\tag{A2} 对式(A2)进行求导可得测角精度Δζ为
\Delta \zeta = \frac{{\Delta \phi \lambda }}{{2{\text{π}}L\cos \zeta }}. \tag{A3} 由式(A3)可见, 当两耳间隔与入射角度一定时, 测角精度与波长关系密切, 即低频分量测角误差大于高频分量。因此利用宽带信号的不同频点可获取目标角度的多个测量值, 且在低频测量精度较低而在高频测量精度相对较高。
设s(t)为蝙蝠的发射声脉冲, 则双耳接收信号分别为
{x_1}(t) = {{\rm e}^{{{ - {\mathrm{j}}2\pi }}f{\tau _1}}}s(t), \tag{A4} {x_2}(t) = {{\rm e}^{{{ - {\mathrm{j}}2\pi }}f{\tau _2}}}s(t).\tag{A5} 按照相位差模型估计目标方位, 双耳回声信号的相位差为
{x_1}(t)x_2^ * (t) = {{\rm e}^{{{ - {\mathrm{j}}2\pi }}f({\tau _1} - {\tau _2})}}s(t){s^ * }(t).\tag{A6} 由此可见, 在保持双耳回声时差不变的条件下, 随着频率的变化, 两者的相位差也会产生相应变化。
基于宽带信号的多频点相位差计算, 阐述DFAIM算法的解模糊原理。选择f1, f2, f3, f4四个频点, 其角度与相位差存在如下关系:
\zeta_n = {\text{arcsin}} \left[\frac{(\varphi_n+2k_n\text{π })v_s}{ 2{\text{π }}Lf_n}\right], \;\; n=1,2,3,4,\tag{A7} 式中,
{\phi _n} 分别对应各频点的双耳回声相位差。实际相位差为{\phi }_{1} + 2{k}_{1}\text{π}, \; {\phi }_{2} + 2{k}_{2}\text{π}, \; {\phi }_{3} + 2{k}_{3}\text{π}, \; {\phi }_{4} + 2{k}_{4}\text{π}, \; k = \cdots ,-1,0,1, 2,\cdots 。不同频点求得的目标角度{\zeta _1} ,{\zeta _2} ,{\zeta _3} ,{\zeta _4} 值处于一定的容差范围内, 可表示为{\zeta _1} \approx {\zeta _2} \approx {\zeta _3} \approx {\zeta _4} . \tag{A8} 式(A3)表明波长较短的谐波测角精度较高, 所以选择高频频率4对应的角度更准确, 即
{\zeta ^{\text{*}}} = {\zeta _4} .\tag{A9} 结合式(A7)和式(A8)即可求确定真实目标角度对应的 k值, 从而得到解模糊后的角度
{\zeta ^{\text{*}}} 。表A1为解模糊仿真场景参数设置。设蝙蝠发射信号的四个不同频率分别为f1 = 20 kHz, f2 = 35 kHz, f3 = 60 kHz, f4 = 70 kHz, 由
\lambda = c/f 得对应波长分别为0.017 m, 0.0097 m, 0.0057 m, 0.0049 m。A1 蝙蝠发射信号和目标参数设置参数 设置值 双耳间距 L (m) 0.01 目标角度 \zeta (°) 54.2 声速 vs (m/s) 340 信号脉宽 \widetilde{T}_m (ms) 5 脉冲重复周期 {{{\overset{\lower6pt\hbox{$\scriptstyle\frown$}} {T}}} _m} (ms) 120 采样频率 Fs (kHz) 200 回波脉冲数 m 4 信噪比SNR (dB) 30 通过计算机仿真, 可以测出双耳在不同频点下的相位差:
{\phi _1} \,=\, 2.9986 rad,{\phi _2} \,=\, -1.0361 rad,{\phi _3} \,=\, 2.7121 rad,{\phi _4} \,= -2.0724 rad。根据式(A7)和式(A8), 得出了符合条件的 k 值: k1=0, k2 = 1, k3 = 1, k4 = 2。将所得 k 值代入模型可进一步求得每个频点的实际相位差为:{\phi _1} + 2{k_1}{\text{π }} = 3.1632 rad,{\phi _2} + 2{k_2}{\text{π }} = 5.2465 rad,{\phi _3} + 2{k_3}{\text{π }} = 8.9922 rad,{\phi _4} + 2{k_4}{\text{π }} = 10.4914 rad。根据式(A2), 结合已知的相位差数据, 可求出不同频点的目标角度:{\zeta _1} = 54.2304°,{\zeta _2} = 54.1834°,{\zeta _3} = 54.2297°,{\zeta _4} = 54.1989°。计算每个角度的误差, 分别为0.0304°, 0.0297°, 0.0166°, 0.0011°。根据式(A9), 选取{\zeta ^{\text{*}}} = 54.1989°, 作为最终测向值, 与 54.2°的设置值进行对比, 误差仅为0.0011°。综上所述, 通过多频点相位差的方法, 可以实现目标方位的高精度解算, 从而有效地解决了模糊的问题。 -
表 1 不同模型性能对比
目标角度 (°) −48.45 −21.25 −1.15 13.25 38.35 误差均方根 (°) BMBBS 测得角度 (°) −48 −21 −1 13 38 — 误差 (°) 0.45 0.25 0.15 −0.25 −0.35 0.3074 DFAIM 测得角度 (°) −48.4512 −21.2511 −1.1476 13.2483 38.3468 — 误差 (°) −0.0012 −0.0011 0.0024 −0.0017 −0.0032 0.0021 A1 蝙蝠发射信号和目标参数设置
参数 设置值 双耳间距 L (m) 0.01 目标角度 \zeta (°) 54.2 声速 vs (m/s) 340 信号脉宽 \widetilde{T}_m (ms) 5 脉冲重复周期 {{{\overset{\lower6pt\hbox{$\scriptstyle\frown$}} {T}}} _m} (ms) 120 采样频率 Fs (kHz) 200 回波脉冲数 m 4 信噪比SNR (dB) 30 -
[1] Jones G, Teeling E C. The evolution of echolocation in bats. Trends Ecol. Evol., 2006; 21(3): 149−156 DOI: 10.1016/j.tree.2006.01.001
[2] Corcoran A J, Weller T J. Inconspicuous echolocation in hoary bats (Lasiurus cinereus). Proc. R. Soc. B, 2018; 285: 20180441 DOI: 10.1098/rspb.2018.0441
[3] Beetz M J, Kössl M, Hechavarría J C. The frugivorous bat Carollia perspicillata dynamically changes echolocation parameters in response to acoustic playback. J. Exp. Biol., 2021; 224(6): jeb.234245 DOI: 10.1242/jeb.234245
[4] Lin A, Liu H, Chang Y, et al. Behavioural response of the greater horseshoe bat to geographical variation in echolocation calls. Behav. Ecol. Sociobiol., 2016; 70(10): 1765−1776 DOI: 10.1007/s00265-016-2182-3
[5] 杨璐慧, 杨蕊, 张留君, 等. 利用残差网络分析普氏蹄蝠耳朵对恒频声源定向的影响. 声学学报, 2023; 48(2): 406−414 DOI: 10.15949/j.cnki.0371-0025.2023.02.005 [6] Yin X Y, Müller R. Integration of deep learning and soft robotics for a biomimetic approach to nonlinear sensing. Nat. Mach. Intell., 2021; 3(6): 507−512 DOI: 10.1038/s42256-021-00330-1
[7] Yang L H, Müller R. Differential entropy analysis of the acoustic characteristics of a biomimetic dynamic sonar emitter. Symmetry, 2020; 12(3): 391 DOI: 10.3390/sym12030391
[8] Caspers P, Müller R. A design for a dynamic biomimetic sonar head inspired by horseshoe bats. Bioinsp. Biomim., 2018; 13(4): 046011 DOI: 10.1088/1748-3190/aac788
[9] Saillant P A, Simmons J A, Dear S P, et al. A computational model of echo processing and acoustic imaging in frequency-modulated echolocating bats: The spectrogram correlation and transformation receiver. J. Acoust. Soc. Am., 1993; 94(5): 2691−2712 DOI: 10.1121/1.407353
[10] Ming C, Haro S, Simmons A M, et al. A comprehensive computational model of animal biosonar signal processing. PLoS Comput. Biol., 2021; 17(2): e1008677 DOI: 10.1371/journal.pcbi.1008677
[11] 杨长生, 李杭波, 胡丽萍, 等. 一种基于距离−方位字典的仿生目标定位方法. 西北工业大学学报, 2021; 39(3): 471−476 DOI: 10.3969/j.issn.1000-2758.2021.03.002 [12] Ma X, Zhang S, Dong Z, et al. Special acoustical role of pinna simplifying spatial target localization by the brown long-eared bat Plecotus auritus. Phys. Rev. E, 2020; 102(4): 040401 DOI: 10.1103/PhysRevE.102.040401
[13] Simmons J A. Echolocation by bats and other animals in air. J. Acoust. Soc. Am, 1983; 73(S1): S75−S76 DOI: 10.1121/1.2020544
[14] Kawase S. Radio interferometer for geosynchronous-satellite direction finding. IEEE Trans. Aerosp. Electron. Syst., 2007; 43(2): 443−449 DOI: 10.1109/TAES.2007.4285345
[15] Lee J H, Woo J M. Interferometer direction-finding system with improved DF accuracy using two different array configurations. IEEE Antennas Wirel. Propag. Lett., 2015; 14: 719−722 DOI: 10.1109/LAWP.2014.2377291
[16] 张劲硕, 吴海峰. 蝙蝠与超声波、回声定位(1). 生物学通报, 2015; 50(3): 1−5 [17] 凌云. 稀疏贝叶斯学习和深度神经网络的波达方向估计方法研究. 博士学位论文, 武汉: 武汉大学, 2020 [18] 姚琳, 刘晓东, 曹金亮, 等. 进行子阵加权波束形成的波达方向估计. 声学学报, 2020; 45(4): 497−505 DOI: 10.15949/j.cnki.0371-0025.2020.04.006 [19] Shin H C, Roth H R, Gao M, et al. Deep convolutional neural networks for computer-aided detection: CNN architectures, dataset characteristics and transfer learning. IEEE Trans. Med. Imaging, 2016; 35(5): 1285−1298 DOI: 10.1109/TMI.2016.2528162
[20] Zhang T, Zeng Y, Zhang Y, et al. Neuron type classification in rat brain based on integrative convolutional and tree-based recurrent neural networks. Sci. Rep., 2021; 11(1): 7291 DOI: 10.1038/s41598-021-86780-4
[21] Masters W M, Jacobs S C, Simmons J A. The structure of echolocation sounds used by the big brown bat Eptesicus fuscus: Some consequences for echo processing. J. Acoust. Soc. Am., 1991; 89(3): 1402−1413 DOI: 10.1121/1.400660
[22] 朱旭, 刘颖, 施利民, 等. 大棕蝠江南亚种回声定位声波特征与分析. 四川动物, 2009; 28(1): 59−63 [23] 崔永锋, 刘伟. 最优仿生大棕蝙蝠声波信号模型及雷达测距. 科技通报, 2014(4): 68−70 DOI: 10.3969/j.issn.1001-7119.2014.04.023 [24] Blauert J. Spatial hearing: The psychophysics of human sound localization. Cambridge: MIT Press, 1997
[25] 刘芬, 罗前刚, 张远征. 高精度超声波测距方法的研究. 自动化与仪表, 2021; 36(5): 66−69 DOI: 10.19557/j.cnki.1001-9944.2021.05.014 [26] 唐业忠, 陈其才, 陈勤. 动物特殊感知系统的研究进展. 科学通报, 2016; 61(23): 2557−2567 DOI: 10.1360/N972015-01161 [27] 肖秀丽. 干涉仪测向原理. 中国无线电, 2006(5): 43−49