Fusion of deep shallow features and models for speaker recognition
-
摘要: 为了进一步提高说话人识别系统的性能,提出基于深、浅层特征融合及基于I-Vector的模型融合的说话人识别。基于深、浅层特征融合的方法充分考虑不同层级特征之间的互补性,通过深、浅层特征的融合,更加全面地描述说话人信息;基于I-Vector模型融合的方法融合不同说话人识别系统提取的I-Vector特征后进行距离计算,在系统的整体结构上综合了不同说话人识别系统的优势。通过利用CASIA南北方言语料库进行测试,以等错误率为衡量指标,相比基线系统,基于深、浅层特征融合的说话人识别其等错误率相对下降了54.8%,基于I-Vector的模型融合的方法其等错误率相对下降了69.5%。实验结果表明,深、浅层特征及模型融合的方法是有效的。Abstract: We propose a features fusion and a models fusion approach for speaker recognition to further improve the performance of speaker recognition. The proposed method of deep and shallow features fusion describes the speaker information more comprehensively because of the complementarity between different level features; the other method fusions the I-Vector extracted from different speaker recognition systems and can combine the advantages of different speaker recognition system. The experimental results show that, the relative improvements from the proposed framework compared to a state-of-the-art system are of 54.8% and 69.5% relative at the equal error rate when evaluated on the CASIA North and South dialect corpus. Proved that the proposed method is effective.
-
Keywords:
- speaker recognition /
- deep features /
- deep neural network /
- model fusion
-
-
期刊类型引用(13)
1. 章子旭,简志华. 采用双重交换表示分离的任意说话人语音转换. 电子学报. 2024(06): 2141-2150 . 百度学术
2. 潘齐炜,程吉祥,田甜,吴丹,曾蕊. 基于特征融合与注意力机制的鸟类声纹识别方法. 声学技术. 2024(05): 686-695 . 百度学术
3. 刘臣,倪仁倢,周立欣,侯昌佑. 多声学特征融合的语音自动剪辑深度学习模型. 小型微型计算机系统. 2023(08): 1713-1719 . 百度学术
4. 盛永健,黄子龙,刘晨,曹毅,张洪. 基于改进卷积神经网络的燃气调压器故障识别研究. 现代制造工程. 2021(04): 132-138 . 百度学术
5. 张兴明,杨凯. 深度学习说话人识别中语音特征参数提取研究. 现代计算机. 2021(08): 3-7+13 . 百度学术
6. 罗春梅,张风雷. 基于均值特征和改进深度神经网络的说话人识别算法. 声学技术. 2021(04): 503-507 . 百度学术
7. 罗春梅. 基于改进MFCC与RCNN的说话人识别算法. 数学的实践与认识. 2021(17): 102-110 . 百度学术
8. 柴庆凤,史霖炎,梅珊,熊海涛,贺惠新. 基于人工特征和机器特征融合的科技文献知识元抽取. 数据分析与知识发现. 2021(08): 132-143 . 百度学术
9. 赵宏,岳鲁鹏,常兆斌,王伟杰. 基于多特征I-Vector的说话人识别算法. 兰州理工大学学报. 2021(05): 93-98 . 百度学术
10. 陈志高,赵庆卫,王丽,王文超. 融合分布对齐和对抗学习的无监督跨域声纹识别. 声学学报. 2021(05): 767-774 . 本站查看
11. 曾春艳,马超峰,王志锋,朱栋梁,赵楠,王娟,刘聪. 深度学习框架下说话人识别研究综述. 计算机工程与应用. 2020(07): 8-16 . 百度学术
12. 郭斐,靳伍银,王猛. 基于改进的Faster R-CNN算法的机械零件图像识别. 机械设计. 2019(09): 113-116 . 百度学术
13. 曹毅,黄子龙,张威,刘晨,李巍. N-DenseNet的城市声音事件分类模型. 西安电子科技大学学报. 2019(06): 9-16+94 . 百度学术
其他类型引用(15)
计量
- 文章访问数: 125
- HTML全文浏览量: 4
- PDF下载量: 27
- 被引次数: 28