教育论文网

深度循环网络在移动端说话人识别中的应用

硕士博士毕业论文站内搜索    
分类1:教育论文网→工业技术论文→无线电电子学、电信技术论文通信论文电声技术和语音信号处理论文语音信号处理论文语音识别与设备论文
分类2:教育论文网→工业技术论文→自动化技术、计算机技术论文自动化基础理论论文人工智能理论论文人工神经网络与计算论文
深度循环网络在移动端说话人识别中的应用
论文目录
 
摘要第1-6页
ABSTRACT第6-11页
第一章 绪论第11-19页
  1.1 研究背景及意义第11-12页
  1.2 国内外研究历史与现状第12-14页
  1.3 说话人识别分类第14-15页
  1.4 说话人识别原理第15-17页
    1.4.1 特征提取第16页
    1.4.2 说话人建模第16-17页
  1.5 本文主要工作和内容安排第17-19页
    1.5.1 本文主要工作第17-18页
    1.5.2 本文内容安排第18-19页
第二章 深度学习相关理论介绍第19-32页
  2.1 深度神经网络第19-27页
    2.1.1 人工神经元模型第19-21页
    2.1.2 深度神经网络结构第21-23页
    2.1.3 使用BP算法训练网络参数第23-27页
  2.2 卷积神经网络第27-29页
    2.2.1 卷积层第27-28页
    2.2.2 池化层第28-29页
  2.3 循环神经网络第29-31页
    2.3.1 基本的循环神经网络第29-30页
    2.3.2 带LSTM单元的循环神经网络第30-31页
  2.4 本章小结第31-32页
第三章 基于CNN和Deep RNN的说话人辨认模型第32-49页
  3.1 模型的总体架构第32-34页
  3.2 语音数据的获取第34-35页
    3.2.1 采样与量化第34页
    3.2.2 采样过程中的参数设置第34-35页
  3.3 语音数据的预处理第35-37页
    3.3.1 预加重第35页
    3.3.2 分帧第35-36页
    3.3.3 加窗第36-37页
    3.3.4 端点检测第37页
  3.4 生成语音数据的语谱图第37-41页
    3.4.1 语谱图的生成流程第38-39页
    3.4.2 宽带语谱图和窄带语谱图第39-40页
    3.4.3 生成说话人的语谱图集合第40-41页
  3.5 网络模型的设计第41-44页
    3.5.1 CNN的设计第41-42页
    3.5.2 Deep RNN的设计第42-44页
  3.6 网络模型的训练阶段第44-47页
    3.6.1 训练数据标签化第46页
    3.6.2 数据标准化第46-47页
    3.6.3 模型的训练第47页
  3.7 网络模型的识别阶段第47页
  3.8 本章小结第47-49页
第四章 模型实现及实验对比第49-68页
  4.1 实验条件第49-51页
    4.1.1 软硬件环境第49页
    4.1.2 语音数据集第49-50页
    4.1.3 识别率的计算第50页
    4.1.4 语谱图的大小第50-51页
  4.2 确定CDRNN模型在自建数据集上的网络结构第51-57页
    4.2.1 确定CNN的网络结构第51-52页
    4.2.2 两种池化操作的对比及分析第52-55页
    4.2.3 确定Deep RNN的网络结构第55-57页
  4.3 CDRNN模型和经典方法的对比第57-60页
    4.3.1 经典方法的识别结果第57-59页
    4.3.2 CDRNN模型的识别结果第59-60页
    4.3.3 两种方法的结果对比第60页
  4.4 CDRNN中的网络模型和其他深度模型的对比第60-67页
    4.4.1 说话人特征提取方面的对比第61-64页
    4.4.2 说话人建模能力方面的对比第64-66页
    4.4.3 实验结果分析第66-67页
  4.5 本章小结第67-68页
第五章 移动端说话人识别系统的原型实现第68-89页
  5.1 引言第68-69页
  5.2 需求分析第69-70页
  5.3 系统设计第70-73页
    5.3.1 模块的划分第71-72页
    5.3.2 模块间的调用关系第72-73页
  5.4 关键模块的实现第73-81页
    5.4.1 网络通信模块的实现第74-75页
    5.4.2 语音录制模块的实现第75-76页
    5.4.3 语谱图生成模块的实现第76-77页
    5.4.4 语谱图识别模块的实现第77-81页
  5.5 系统测试第81-87页
    5.5.1 服务器地址设置功能测试第81-83页
    5.5.2 上传说话人语音功能测试第83-85页
    5.5.3 更新模型库功能测试第85页
    5.5.4 识别说话人语音功能测试第85-87页
  5.6 本章总结第87-89页
第六章 全文总结与展望第89-91页
  6.1 全文总结第89-90页
  6.2 后续工作展望第90-91页
致谢第91-92页
参考文献第92-96页

本篇论文共96页,点击这进入下载页面
 
更多论文
深度循环网络在移动端说话人识别中
Navier-Stokes-Poisson方程组外流问
WIFI音箱的设计与实现
体积填充作用下具有对偶梯度的趋化
基于B/S架构的语料库管理系统
Gosper方程的初步研究
基于MEMS数字麦克风阵列的声源定位
语音信号盲分离算法研究
一类半线性椭圆方程的多解性研究
混合激励线性预测语音编码算法的实
无单元Galerkin方法及其应用
基于DSP的多路实时音频编码的设计实
二阶Kuramoto模型的频率同步
低速率水下语音压缩技术及DSP实现
求解Vlasov-Poisson方程组的时间分
噪音环境下的说话人识别算法研究
两类分数阶微分方程的振动性
噪声环境下基于谱减法的语音识别研
带有线性收获项和混合时滞的Nichol
长距离语言模型及其应用研究
一类带概自守系数的复值脉冲神经网
一类广义非线性波动方程解的性态
语音识别中的特征不变性研究
带有修正Chaplygin气体压力的Aw-Ra
复杂环境下基于GMM和SVM的语音激活
基于时域频域联合的连续语音关键词
广义Chaplygin气体方程组的狄拉克激
3D可视化言语表达和情感模拟研究
具有离散和分布时滞的复值C-G神经网
基于抑郁人群语音数据的诱导方式的
一类拟线性Schr(?)dinger方程解的存
FCBF特征选择算法优化及基于语音的
基于音频信号处理的音乐风格研究
一类具非瞬时脉冲的分数阶微分方程
无线缓存网络中关键技术的研究
系数退化的一类拟线性抛物方程解的
DSL光铜融合传输关键技术研究与验证
一类非局部抛物方程解的整体存在和
无线接入网中虚拟定制网络技术
四川移动G网阿坝扩容风险管理研究
一类奇异抛物方程解的存在性和渐进
低压电力线信道特性与噪声模型的研
散度型非线性随机波动方程解的二阶
移动终端安全高效准入控制技术研究
输入性病例引发MERS流行的动力学模
电力线载波的信道特性分析及其组网
一类二阶有理差分方程的稳定性和周
基于SDR的64QAM调制解调器的FPGA设
一维拟线性波动方程的精确边界能控
DTN散发等待路由及拥塞控制方法的研
两类时-空分数阶扩散方程反问题稳定
一种基于Agent的中压电力线载波通信
OpenADR通信协议一致性测试系统设计
MQ-拟插值方法及在b-方程中的应用
通信网络效能评估理论模型与仿真算
分数阶扩散方程求解算法研究
面向下一代移动通信的汇聚与接入网
一类具有变时滞的神经网络稳定性的
基于OpenWrt的无线网络安全检测系统
非线性Boussinesq方程的Cauchy问题
低压电力线载波通信系统关键技术研
时域积分方程方法数值性能改进的若
网络功能虚拟化网关研究与测试
高速节点协同自组织网关键协议的研
二维的Volterra-Fredholm积分方程的
青海铁通GPON宽带接入网工程设计与
D-AKNS方程族的超扩展
高速跳频通信信号的序列分析
含有Stokes阻尼项的IBq方程Cauchy问
并行组合扩频系统伪码同步相关技术
孤子方程的特征函数方程及其B(a|")
基于EH天线的数字通信系统设计与实
用反谱变换求解TD方程
并行组合扩频通信中序列优选与抗序
双色散方程的初边值问题
机载通信系统的可靠性设计及实现
基于异构网络多链路并行的电力应急
具有结构阻尼的Kirchhoff型方程的长
调频寄生通信系统的设计与实现
一个与3×3矩阵谱问题相关的孤子方
嵌入式VoIP Server的设计与实现
Reissner-Mindlin板问题的混合有限
软交换VoIP流量模拟器的设计与实现
超材料电磁场研究的新模式与方法
构造de Bruijn序列方法的研究
双曲型方程非协调有限元方法研究
基于身份匿名广播加密方案研究
可撤销基于属性加密算法研究
一种新的有限元逼近非线性麦克斯韦
基于混沌同步的多路通信研究
 
说话人识别论文 深度学习论文 语谱图论文 深度循环神经网络论文 卷积神经网络论文
版权申明:目录由用户luoweiq**提供,www.51papers.com仅收录目录,作者需要删除这篇论文目录请点击这里
| 设为首页||加入收藏||站内搜索引擎||站点地图||在线购卡|
版权所有 教育论文网 Copyright(C) All Rights Reserved