深度循环网络在移动端说话人识别中的应用

	载入中...

深度循环网络在移动端说话人识别中的应用

分类1：教育论文网→工业技术论文→无线电电子学、电信技术论文→通信论文→电声技术和语音信号处理论文→语音信号处理论文→语音识别与设备论文
分类2：教育论文网→工业技术论文→自动化技术、计算机技术论文→自动化基础理论论文→人工智能理论论文→人工神经网络与计算论文

深度循环网络在移动端说话人识别中的应用

论文目录
摘要	第1-6页
ABSTRACT	第6-11页
第一章绪论	第11-19页
1.1 研究背景及意义	第11-12页
1.2 国内外研究历史与现状	第12-14页
1.3 说话人识别分类	第14-15页
1.4 说话人识别原理	第15-17页
1.4.1 特征提取	第16页
1.4.2 说话人建模	第16-17页
1.5 本文主要工作和内容安排	第17-19页
1.5.1 本文主要工作	第17-18页
1.5.2 本文内容安排	第18-19页
第二章深度学习相关理论介绍	第19-32页
2.1 深度神经网络	第19-27页
2.1.1 人工神经元模型	第19-21页
2.1.2 深度神经网络结构	第21-23页
2.1.3 使用BP算法训练网络参数	第23-27页
2.2 卷积神经网络	第27-29页
2.2.1 卷积层	第27-28页
2.2.2 池化层	第28-29页
2.3 循环神经网络	第29-31页
2.3.1 基本的循环神经网络	第29-30页
2.3.2 带LSTM单元的循环神经网络	第30-31页
2.4 本章小结	第31-32页
第三章基于CNN和Deep RNN的说话人辨认模型	第32-49页
3.1 模型的总体架构	第32-34页
3.2 语音数据的获取	第34-35页
3.2.1 采样与量化	第34页
3.2.2 采样过程中的参数设置	第34-35页
3.3 语音数据的预处理	第35-37页
3.3.1 预加重	第35页
3.3.2 分帧	第35-36页
3.3.3 加窗	第36-37页
3.3.4 端点检测	第37页
3.4 生成语音数据的语谱图	第37-41页
3.4.1 语谱图的生成流程	第38-39页
3.4.2 宽带语谱图和窄带语谱图	第39-40页
3.4.3 生成说话人的语谱图集合	第40-41页
3.5 网络模型的设计	第41-44页
3.5.1 CNN的设计	第41-42页
3.5.2 Deep RNN的设计	第42-44页
3.6 网络模型的训练阶段	第44-47页
3.6.1 训练数据标签化	第46页
3.6.2 数据标准化	第46-47页
3.6.3 模型的训练	第47页
3.7 网络模型的识别阶段	第47页
3.8 本章小结	第47-49页
第四章模型实现及实验对比	第49-68页
4.1 实验条件	第49-51页
4.1.1 软硬件环境	第49页
4.1.2 语音数据集	第49-50页
4.1.3 识别率的计算	第50页
4.1.4 语谱图的大小	第50-51页
4.2 确定CDRNN模型在自建数据集上的网络结构	第51-57页
4.2.1 确定CNN的网络结构	第51-52页
4.2.2 两种池化操作的对比及分析	第52-55页
4.2.3 确定Deep RNN的网络结构	第55-57页
4.3 CDRNN模型和经典方法的对比	第57-60页
4.3.1 经典方法的识别结果	第57-59页
4.3.2 CDRNN模型的识别结果	第59-60页
4.3.3 两种方法的结果对比	第60页
4.4 CDRNN中的网络模型和其他深度模型的对比	第60-67页
4.4.1 说话人特征提取方面的对比	第61-64页
4.4.2 说话人建模能力方面的对比	第64-66页
4.4.3 实验结果分析	第66-67页
4.5 本章小结	第67-68页
第五章移动端说话人识别系统的原型实现	第68-89页
5.1 引言	第68-69页
5.2 需求分析	第69-70页
5.3 系统设计	第70-73页
5.3.1 模块的划分	第71-72页
5.3.2 模块间的调用关系	第72-73页
5.4 关键模块的实现	第73-81页
5.4.1 网络通信模块的实现	第74-75页
5.4.2 语音录制模块的实现	第75-76页
5.4.3 语谱图生成模块的实现	第76-77页
5.4.4 语谱图识别模块的实现	第77-81页
5.5 系统测试	第81-87页
5.5.1 服务器地址设置功能测试	第81-83页
5.5.2 上传说话人语音功能测试	第83-85页
5.5.3 更新模型库功能测试	第85页
5.5.4 识别说话人语音功能测试	第85-87页
5.6 本章总结	第87-89页
第六章全文总结与展望	第89-91页
6.1 全文总结	第89-90页
6.2 后续工作展望	第90-91页
致谢	第91-92页
参考文献	第92-96页

本篇论文共96页，点击这进入下载页面。

更多论文
深度循环网络在移动端说话人识别中
Navier-Stokes-Poisson方程组外流问
WIFI音箱的设计与实现
体积填充作用下具有对偶梯度的趋化
基于B/S架构的语料库管理系统
Gosper方程的初步研究
基于MEMS数字麦克风阵列的声源定位
语音信号盲分离算法研究
一类半线性椭圆方程的多解性研究
混合激励线性预测语音编码算法的实
无单元Galerkin方法及其应用
基于DSP的多路实时音频编码的设计实
二阶Kuramoto模型的频率同步
低速率水下语音压缩技术及DSP实现
求解Vlasov-Poisson方程组的时间分
噪音环境下的说话人识别算法研究
两类分数阶微分方程的振动性
噪声环境下基于谱减法的语音识别研
带有线性收获项和混合时滞的Nichol
长距离语言模型及其应用研究
一类带概自守系数的复值脉冲神经网
一类广义非线性波动方程解的性态
语音识别中的特征不变性研究
带有修正Chaplygin气体压力的Aw-Ra
复杂环境下基于GMM和SVM的语音激活
基于时域频域联合的连续语音关键词
广义Chaplygin气体方程组的狄拉克激
3D可视化言语表达和情感模拟研究
具有离散和分布时滞的复值C-G神经网
基于抑郁人群语音数据的诱导方式的
一类拟线性Schr(?)dinger方程解的存
FCBF特征选择算法优化及基于语音的
基于音频信号处理的音乐风格研究
一类具非瞬时脉冲的分数阶微分方程
无线缓存网络中关键技术的研究
系数退化的一类拟线性抛物方程解的
DSL光铜融合传输关键技术研究与验证
一类非局部抛物方程解的整体存在和
无线接入网中虚拟定制网络技术
四川移动G网阿坝扩容风险管理研究
一类奇异抛物方程解的存在性和渐进
低压电力线信道特性与噪声模型的研
散度型非线性随机波动方程解的二阶
移动终端安全高效准入控制技术研究
输入性病例引发MERS流行的动力学模
电力线载波的信道特性分析及其组网
一类二阶有理差分方程的稳定性和周
基于SDR的64QAM调制解调器的FPGA设
一维拟线性波动方程的精确边界能控
DTN散发等待路由及拥塞控制方法的研
两类时-空分数阶扩散方程反问题稳定
一种基于Agent的中压电力线载波通信
OpenADR通信协议一致性测试系统设计
MQ-拟插值方法及在b-方程中的应用
通信网络效能评估理论模型与仿真算
分数阶扩散方程求解算法研究
面向下一代移动通信的汇聚与接入网
一类具有变时滞的神经网络稳定性的
基于OpenWrt的无线网络安全检测系统
非线性Boussinesq方程的Cauchy问题
低压电力线载波通信系统关键技术研
时域积分方程方法数值性能改进的若
网络功能虚拟化网关研究与测试
高速节点协同自组织网关键协议的研
二维的Volterra-Fredholm积分方程的
青海铁通GPON宽带接入网工程设计与
D-AKNS方程族的超扩展
高速跳频通信信号的序列分析
含有Stokes阻尼项的IBq方程Cauchy问
并行组合扩频系统伪码同步相关技术
孤子方程的特征函数方程及其B(a\|")
基于EH天线的数字通信系统设计与实
用反谱变换求解TD方程
并行组合扩频通信中序列优选与抗序
双色散方程的初边值问题
机载通信系统的可靠性设计及实现
基于异构网络多链路并行的电力应急
具有结构阻尼的Kirchhoff型方程的长
调频寄生通信系统的设计与实现
一个与3×3矩阵谱问题相关的孤子方
嵌入式VoIP Server的设计与实现
Reissner-Mindlin板问题的混合有限
软交换VoIP流量模拟器的设计与实现
超材料电磁场研究的新模式与方法
构造de Bruijn序列方法的研究
双曲型方程非协调有限元方法研究
基于身份匿名广播加密方案研究
可撤销基于属性加密算法研究
一种新的有限元逼近非线性麦克斯韦
基于混沌同步的多路通信研究

说话人识别论文深度学习论文语谱图论文深度循环神经网络论文卷积神经网络论文
版权申明：目录由用户luoweiq**提供，www.51papers.com仅收录目录，作者需要删除这篇论文目录请点击这里。
\| 设为首页\|\|加入收藏\|\|站内搜索引擎\|\|站点地图\|\|在线购卡\|
版权所有教育论文网 Copyright(C) All Rights Reserved