基于深度学习的语音增强技术研究

	载入中...

基于深度学习的语音增强技术研究

分类：教育论文网→工业技术论文→无线电电子学、电信技术论文→通信论文→电声技术和语音信号处理论文→语音信号处理论文→语音增强论文

基于深度学习的语音增强技术研究

论文目录
摘要	第1-6页
ABSTRACT	第6-14页
第一章绪论	第14-29页
1.1 语音增强的定义	第14页
1.2 研究背景与研究意义	第14-15页
1.3 语音增强技术的发展历程与研究现状	第15-25页
1.3.1 监督性语音增强的系统结构	第16-17页
1.3.2 时频分解	第17-18页
1.3.3 特征提取	第18-19页
1.3.4 训练目标	第19-22页
1.3.5 模型建立	第22-25页
1.4 论文主要内容和结构安排	第25-29页
第二章基于深度神经网络的语音增强	第29-42页
2.1 DNN原理分析	第29-32页
2.1.1 DNN基本结构	第29-30页
2.1.2 参数训练	第30页
2.1.3 代价函数	第30页
2.1.4 反向传播算法	第30-31页
2.1.5 模型初始化	第31页
2.1.6 批量块大小的选择	第31-32页
2.1.7 学习速率	第32页
2.2 基于DNN的语音增强	第32-37页
2.2.1 人耳对声音的处理	第33页
2.2.2 特征提取	第33-35页
2.2.3 训练目标	第35-36页
2.2.4 语音合成	第36页
2.2.5 评价指标	第36-37页
2.3 实验语料选取	第37-38页
2.4 IBM和IRM对比实验	第38-39页
2.5 实验结果与分析	第39-41页
2.5.1 实验噪声选取	第39页
2.5.2 训练集和测试集生成方式	第39页
2.5.3 基于DNN的语音增强实验	第39-41页
2.6 本章小结	第41-42页
第三章深度学习语音增强中的MRCG特征优化与互补特征选择	第42-60页
3.1 人耳听觉信息处理	第42-44页
3.1.1 对耳蜗模型的拟合	第42-43页
3.1.2 耳蜗谱图	第43-44页
3.2 MRCG特征提取与改进	第44-48页
3.2.1 MRCG特征原理	第44页
3.2.2 改进的MRCG特征	第44-47页
3.2.3 ARMA滤波器平滑	第47-48页
3.3 互补特征选择	第48-49页
3.3.1 常用语音增强特征	第48-49页
3.3.2 互补特征鉴定	第49页
3.4 实验结果与分析	第49-59页
3.4.1 实验语料	第49-50页
3.4.2 HIT-FA评价指标	第50-51页
3.4.3 ARMA滤波器阶数选择实验	第51页
3.4.4 基于改进MRCG特征的语音增强实验	第51-56页
3.4.5 基于Alpha均值滤波器的改进MRCG特征窗长选择实验	第56-57页
3.4.6 互补特征选择实验	第57-58页
3.4.7 基于互补特征的DNN语音增强系统实验	第58-59页
3.5 本章小结	第59-60页
第四章深度学习语音增强中的模型优化	第60-76页
4.1 DNN训练策略优化	第60-64页
4.1.1 丢弃算法	第60-61页
4.1.2 整流线性单元	第61-62页
4.1.3 受限玻尔兹曼机预训练	第62-64页
4.2 CNN原理分析	第64-67页
4.2.1 CNN网络结构	第64-65页
4.2.2 卷积处理	第65-66页
4.2.3 池化处理	第66页
4.2.4 CNN模型参数训练	第66-67页
4.3 联合DNN和CNN的语音增强模型	第67-70页
4.3.1 基于DNN的掩蔽值估计	第68页
4.3.2 基于CNN的掩蔽值识别	第68-70页
4.4 实验结果与分析	第70-75页
4.4.1 实验语料	第70页
4.4.2 基于RBM预训练的DNN语音增强系统实验	第70-72页
4.4.3 基于dropout和ReLU激活函数的DNN语音增强系统实验	第72-73页
4.4.4 联合DNN和CNN的语音增强实验	第73-75页
4.5 本章小结	第75-76页
第五章总结与展望	第76-79页
5.1 本文主要工作	第76-77页
5.2 下一步研究方向	第77-79页
致谢	第79-81页
参考文献	第81-87页
作者简历	第87页

本篇论文共87页，点击这进入下载页面。

更多论文
基于深度学习的语音增强技术研究
真空激光加速中性粒子研究
低资源环境下的语音识别技术研究
化学反应速率的统计物理模型研究
深度神经网络的说话人自适应技术研
石墨烯单层条中的拓扑绝缘体输运性
激光侦测系统中的语音增强技术研究
重费米子超导体Ce₂PdIn
基于配位信息的语种识别技术研究
基于图形化衬底的石墨烯定点制备及
总线式数字音频扩声终端的设计
石墨烯中电子的类光输运研究
基于CobraNet技术的网络音频处理系
镀膜铷泡中的运动平均效应
基于稀疏表示和深度学习的欠定语音
光敏材料的有序排列及偏光记忆效应
基于个性化头相关传递函数的三维音
基于小波分析的双波长散斑干涉测量
基于分布式麦克风阵列的声源定位方
复合光纤干涉位移测量系统的研究
用于音频篡改检测的数字音频取证技
非线性扫描的绝热过程
语音质量客观评价技术及系统研制
二量子比特系统对称Quantum Discor
基于深度学习和模糊理论的语音情感
不同时空背景下的全息热化过程和纠
自适应双数据流语音增强方法研究
非牛顿流体耦合方程的收敛性分析
基于加权主成分的短语音说话人识别
镁中Ⅰ型裂纹应力场与裂尖塑性变形
连续语音中的笑声检测研究与实现
超长主厂房结构温度应力的试验测量
语音识别软件关键技术的研究
四边自由等厚度及阶梯型方形薄板内
MP3解码电路的IC设计
复杂系统的适应性与敏感性讨论
基于本体与SNMP的网络状态评估及原
基于L₂-Fused Lasso变量
HFC系统中光接收机的应用
基于贝叶斯方法的均匀分布变点的估
郑州移动集团客户业务接入模式改进
具间断系数的高阶拟线性椭圆方程的
宽带跳频电台调制解调器的研究与实
拟线性次椭圆方程（组）的正则性
面向QualNet的可编程动态交互接口设
二维涡度方程的多区域Chebyshev-Le
移动无线多媒体接入网关项目进度控
阿波罗网络上的沙堆模型
PC间基于FPGA的万兆网络传输平台设
复杂网络中演化博弈的移动与趋同现
通信网络中基于用户和网络合作的休
复杂社会网络结构与创新抗拒关系的
智能家居多协议网关的设计与实现
严格成对不平衡可分组设计
多用户无线网络中拓扑管理与资源分
八维六次超混沌系统及其应用
图的最大度、独立数与谱半径
服务中心网络的服务寻址与路由关键
关于图的零度和无符号拉普拉斯谱半
基于交叉点缓存的高速交换结构及调
关于图的亏格分布的确定
基于SDNFV的服务功能链部署优化技术
几个图类的领域连通性
基于超声波通信道的信道估计和自适
光伏技术的社会选择初探
大动态深度扩频低复杂度伪码捕获技
人与自然的和谐—马克思人化自然观
高动态天基测控信号模拟器
多震相初至自动检测识别方法技术
SDH传输网双归属方案设计应用
陕西省地震震源参数的研究及软件编
基于Wimax技术的煤矿无线管理监测通
磁重联区X线上的电阻率梯度对磁重联
炮兵通信对抗中跳速自适应跳频应用
伴随地球磁尾偶极化锋面的电子加速
基于DPDK的VoIP流量识别技术研究
各向异性等离子体中量子和半相对论
基于中间相遇思想的攻击方法研究
地球附近1996-2012年行星际日冕物质
分组密码算法的可重构关键技术研究
西昆仑弧形构造带古地磁研究及演化

语音增强论文深度神经网络论文卷积神经网络论文互补特征论文理想率值掩蔽论文
版权申明：目录由用户a36265787**提供，www.51papers.com仅收录目录，作者需要删除这篇论文目录请点击这里。
\| 设为首页\|\|加入收藏\|\|站内搜索引擎\|\|站点地图\|\|在线购卡\|
版权所有教育论文网 Copyright(C) All Rights Reserved