教育论文网

基于深度学习的语音增强技术研究

硕士博士毕业论文站内搜索    
分类:教育论文网→工业技术论文→无线电电子学、电信技术论文通信论文电声技术和语音信号处理论文语音信号处理论文语音增强论文
基于深度学习的语音增强技术研究
论文目录
 
摘要第1-6页
ABSTRACT第6-14页
第一章 绪论第14-29页
  1.1 语音增强的定义第14页
  1.2 研究背景与研究意义第14-15页
  1.3 语音增强技术的发展历程与研究现状第15-25页
    1.3.1 监督性语音增强的系统结构第16-17页
    1.3.2 时频分解第17-18页
    1.3.3 特征提取第18-19页
    1.3.4 训练目标第19-22页
    1.3.5 模型建立第22-25页
  1.4 论文主要内容和结构安排第25-29页
第二章 基于深度神经网络的语音增强第29-42页
  2.1 DNN原理分析第29-32页
    2.1.1 DNN基本结构第29-30页
    2.1.2 参数训练第30页
    2.1.3 代价函数第30页
    2.1.4 反向传播算法第30-31页
    2.1.5 模型初始化第31页
    2.1.6 批量块大小的选择第31-32页
    2.1.7 学习速率第32页
  2.2 基于DNN的语音增强第32-37页
    2.2.1 人耳对声音的处理第33页
    2.2.2 特征提取第33-35页
    2.2.3 训练目标第35-36页
    2.2.4 语音合成第36页
    2.2.5 评价指标第36-37页
  2.3 实验语料选取第37-38页
  2.4 IBM和IRM对比实验第38-39页
  2.5 实验结果与分析第39-41页
    2.5.1 实验噪声选取第39页
    2.5.2 训练集和测试集生成方式第39页
    2.5.3 基于DNN的语音增强实验第39-41页
  2.6 本章小结第41-42页
第三章 深度学习语音增强中的MRCG特征优化与互补特征选择第42-60页
  3.1 人耳听觉信息处理第42-44页
    3.1.1 对耳蜗模型的拟合第42-43页
    3.1.2 耳蜗谱图第43-44页
  3.2 MRCG特征提取与改进第44-48页
    3.2.1 MRCG特征原理第44页
    3.2.2 改进的MRCG特征第44-47页
    3.2.3 ARMA滤波器平滑第47-48页
  3.3 互补特征选择第48-49页
    3.3.1 常用语音增强特征第48-49页
    3.3.2 互补特征鉴定第49页
  3.4 实验结果与分析第49-59页
    3.4.1 实验语料第49-50页
    3.4.2 HIT-FA评价指标第50-51页
    3.4.3 ARMA滤波器阶数选择实验第51页
    3.4.4 基于改进MRCG特征的语音增强实验第51-56页
    3.4.5 基于Alpha均值滤波器的改进MRCG特征窗长选择实验第56-57页
    3.4.6 互补特征选择实验第57-58页
    3.4.7 基于互补特征的DNN语音增强系统实验第58-59页
  3.5 本章小结第59-60页
第四章 深度学习语音增强中的模型优化第60-76页
  4.1 DNN训练策略优化第60-64页
    4.1.1 丢弃算法第60-61页
    4.1.2 整流线性单元第61-62页
    4.1.3 受限玻尔兹曼机预训练第62-64页
  4.2 CNN原理分析第64-67页
    4.2.1 CNN网络结构第64-65页
    4.2.2 卷积处理第65-66页
    4.2.3 池化处理第66页
    4.2.4 CNN模型参数训练第66-67页
  4.3 联合DNN和CNN的语音增强模型第67-70页
    4.3.1 基于DNN的掩蔽值估计第68页
    4.3.2 基于CNN的掩蔽值识别第68-70页
  4.4 实验结果与分析第70-75页
    4.4.1 实验语料第70页
    4.4.2 基于RBM预训练的DNN语音增强系统实验第70-72页
    4.4.3 基于dropout和ReLU激活函数的DNN语音增强系统实验第72-73页
    4.4.4 联合DNN和CNN的语音增强实验第73-75页
  4.5 本章小结第75-76页
第五章 总结与展望第76-79页
  5.1 本文主要工作第76-77页
  5.2 下一步研究方向第77-79页
致谢第79-81页
参考文献第81-87页
作者简历第87页

本篇论文共87页,点击这进入下载页面
 
更多论文
基于深度学习的语音增强技术研究
真空激光加速中性粒子研究
低资源环境下的语音识别技术研究
化学反应速率的统计物理模型研究
深度神经网络的说话人自适应技术研
石墨烯单层条中的拓扑绝缘体输运性
激光侦测系统中的语音增强技术研究
重费米子超导体Ce2PdIn
基于配位信息的语种识别技术研究
基于图形化衬底的石墨烯定点制备及
总线式数字音频扩声终端的设计
石墨烯中电子的类光输运研究
基于CobraNet技术的网络音频处理系
镀膜铷泡中的运动平均效应
基于稀疏表示和深度学习的欠定语音
光敏材料的有序排列及偏光记忆效应
基于个性化头相关传递函数的三维音
基于小波分析的双波长散斑干涉测量
基于分布式麦克风阵列的声源定位方
复合光纤干涉位移测量系统的研究
用于音频篡改检测的数字音频取证技
非线性扫描的绝热过程
语音质量客观评价技术及系统研制
二量子比特系统对称Quantum Discor
基于深度学习和模糊理论的语音情感
不同时空背景下的全息热化过程和纠
自适应双数据流语音增强方法研究
非牛顿流体耦合方程的收敛性分析
基于加权主成分的短语音说话人识别
镁中Ⅰ型裂纹应力场与裂尖塑性变形
连续语音中的笑声检测研究与实现
超长主厂房结构温度应力的试验测量
语音识别软件关键技术的研究
四边自由等厚度及阶梯型方形薄板内
MP3解码电路的IC设计
复杂系统的适应性与敏感性讨论
基于本体与SNMP的网络状态评估及原
基于L2-Fused Lasso变量
HFC系统中光接收机的应用
基于贝叶斯方法的均匀分布变点的估
郑州移动集团客户业务接入模式改进
具间断系数的高阶拟线性椭圆方程的
宽带跳频电台调制解调器的研究与实
拟线性次椭圆方程(组)的正则性
面向QualNet的可编程动态交互接口设
二维涡度方程的多区域Chebyshev-Le
移动无线多媒体接入网关项目进度控
阿波罗网络上的沙堆模型
PC间基于FPGA的万兆网络传输平台设
复杂网络中演化博弈的移动与趋同现
通信网络中基于用户和网络合作的休
复杂社会网络结构与创新抗拒关系的
智能家居多协议网关的设计与实现
严格成对不平衡可分组设计
多用户无线网络中拓扑管理与资源分
八维六次超混沌系统及其应用
图的最大度、独立数与谱半径
服务中心网络的服务寻址与路由关键
关于图的零度和无符号拉普拉斯谱半
基于交叉点缓存的高速交换结构及调
关于图的亏格分布的确定
基于SDNFV的服务功能链部署优化技术
几个图类的领域连通性
基于超声波通信道的信道估计和自适
光伏技术的社会选择初探
大动态深度扩频低复杂度伪码捕获技
人与自然的和谐—马克思人化自然观
高动态天基测控信号模拟器
多震相初至自动检测识别方法技术
SDH传输网双归属方案设计应用
陕西省地震震源参数的研究及软件编
基于Wimax技术的煤矿无线管理监测通
磁重联区X线上的电阻率梯度对磁重联
炮兵通信对抗中跳速自适应跳频应用
伴随地球磁尾偶极化锋面的电子加速
基于DPDK的VoIP流量识别技术研究
各向异性等离子体中量子和半相对论
基于中间相遇思想的攻击方法研究
地球附近1996-2012年行星际日冕物质
分组密码算法的可重构关键技术研究
西昆仑弧形构造带古地磁研究及演化
 
语音增强论文 深度神经网络论文 卷积神经网络论文 互补特征论文 理想率值掩蔽论文
版权申明:目录由用户a36265787**提供,www.51papers.com仅收录目录,作者需要删除这篇论文目录请点击这里
| 设为首页||加入收藏||站内搜索引擎||站点地图||在线购卡|
版权所有 教育论文网 Copyright(C) All Rights Reserved