教育论文网

基于i-vector的说话人识别的研究

硕士博士毕业论文站内搜索    
分类:教育论文网→工业技术论文→无线电电子学、电信技术论文通信论文电声技术和语音信号处理论文语音信号处理论文语音识别与设备论文
基于i-vector的说话人识别的研究
论文目录
 
摘要第1-5页
ABSTRACT第5-13页
第一章 绪论第13-17页
  1.1 课题背景及研究目的与意义第13-14页
  1.2 说话人识别的发展历史和研究现状第14-15页
  1.3 未解决的问题第15-16页
  1.4 本文研究内容及安排第16-17页
第二章 说话人识别简介第17-20页
  2.1 说话人识别的类别第17-18页
  2.2 说话人识别的原理和结构第18-19页
  2.3 说话人识别的特征提取第19页
  2.4 评价指标第19页
  2.5 本章小节第19-20页
第三章 语音信号处理第20-33页
  3.1 语音信号的产生第20-21页
    3.1.1 语音信号的产生机理第20页
    3.1.2 语音信号产生的数学模型第20-21页
  3.2 语音信号的预处理第21-24页
    3.2.1 采样与量化第21页
    3.2.2 归一化第21页
    3.2.3 端点检测第21-22页
    3.2.4 预加重第22-23页
    3.2.5 加窗第23-24页
  3.3 语音信号的时域分析第24-26页
    3.3.1 短时平均能量第24-25页
    3.3.2 短时平均过零率第25-26页
  3.4 语音信号的频域分析第26页
  3.5 语音信号的同态倒谱分析第26-27页
    3.5.1 倒谱和复倒谱第26-27页
    3.5.2 线性预测系数第27页
  3.6 语音信号特征提取第27-32页
    3.6.1 梅尔频率倒谱系数第27-31页
    3.6.2 线性预测倒谱系数第31页
    3.6.3 感知线性预测系数第31页
    3.6.4 其他特征第31页
    3.6.5 短时归一化能量第31-32页
    3.6.6 语音信号的动态特征第32页
  3.7 本章小结第32-33页
第四章 说话人识别基本技术及算法第33-38页
  4.1 说话人识别系统的基本构成第33页
  4.2 期望最大化算法第33-36页
    4.2.1 EM算法的一种常见形式第33-35页
    4.2.2 EM算法的一般化形式第35-36页
  4.3 高斯混合模型-通用背景模型第36-37页
  4.4 因子分析技术第37页
  4.5 本章小结第37-38页
第五章 基于i-vector的说话人识别第38-44页
  5.1 基于因子分析的i-vector模型第38-39页
  5.2 i-vector模型描述第39页
  5.3 i-vector模型参数的估计第39-41页
    5.3.1 GMM均值超向量M的计算第39-40页
    5.3.2 基于因子分析的总体变化子空间的估计第40-41页
  5.4 信道补偿技术第41-42页
  5.5 i-vector的提取第42-43页
    5.5.1 基于权矩阵第42页
    5.5.2 基于自变量线性组合第42-43页
  5.6 模型打分器第43页
  5.7 本章小结第43-44页
第六章 基于i-vector的说话人识别系统的实现与实验成果第44-53页
  6.1 系统环境和功能模块第44-46页
    6.1.1 软件和硬件环境第44页
    6.1.2 系统功能和模块介绍第44-46页
  6.2 实验数据库和实验配置第46-47页
    6.2.1 实验数据与设置第46页
    6.2.2 实验中各主要参数第46-47页
    6.2.3 实验设计第47页
  6.3 实验结果与分析第47-51页
    6.3.1 端点检测第47页
    6.3.2 MFCC特征维数第47-48页
    6.3.3 不同的特征提取方法对比实验第48页
    6.3.4 高斯混合密度个数第48-49页
    6.3.5 总体变化子空间T的初始化第49页
    6.3.6 总体变化子空间T的维数第49-50页
    6.3.7 语音长度第50-51页
    6.3.8 训练语音数目第51页
  6.4 不同模型识别性能比较第51-52页
  6.5 本章小节第52-53页
第七章 总结与展望第53-54页
  7.1 总结第53页
  7.2 展望第53-54页
参考文献第54-57页
致谢第57页

本篇论文共57页,点击这进入下载页面
 
更多论文
基于i-vector的说话人识别的研究
基于过滤封装混合模型的语音情感特
基于语音识别的电子病历辅助编辑系
基于特征评估和多层感知器的语音情
基于音频指纹的分片音频检索算法的
陕西地区出土2200年前人颌骨及牙齿
博物馆智能讲解设备的多通道人机交
中国紫萼藓科(Grimmiaceae)植物分
基于深度学习的语音识别控制系统研
紫萼藓科植物GH120、GH395基因同源
基于双麦克风阵列的微型语音降噪系
毛尖紫萼藓GH394基因生物信息学分析
基于麦克风阵列音频信号时频分析的
几种特定生物学功能的微生物的筛选
机固混合网网络管理系统的设计与实
Synaptotagmin 1 siRNA表达载体构建
智慧协同网络中边界路由器的设计与
气道内微量雾化机对质粒DNA完整性和
呼和浩特市巨海城小区GPON网络的接
双链RNA依赖的蛋白激酶PKR激酶结构
正交频分复用窄带载波在电控阀通信
蛋白质相互作用界面中热点残基预测
路由器线卡QoS芯片ESL建模并仿真
复杂系统仿真中系统演化复杂性判别
武鸣区边远农村FTTH接入方法的研究
基于ARM嵌入式处理器的工业通讯网关
扩频通信在人防警报系统中的应用研
基于解码转发中继的无线携能通信系
论技术负面价值的成因及其弱化措施
智能车间群组实时通信系统的研究与
13-15世纪科学方法与神学方法的比较
基于ARM架构和混沌理论的实时图像和
国家战略工程与我国自主创新能力建
无线自组网络的密钥管理认证系统设
明文转换为DNA序列的对称密码算法与
耐辐射奇球菌pprI基因定点整合酵母
可抗复制的无线数字身份认证协议研
铀酰离子与细胞色素b5
可认证的密钥协商协议研究
二维Y型分叉血管模型的有限元分析及
整数剩余类环上截位序列还原研究
我国房地产上市公司股权结构与公司
县级电力综合数据网的建设与业务应
几类有理差分方程动力学性质的研究
基于H.264的全景视频编解码技术研究
具有年龄结构的HIV感染模型稳定性研
基于运动矢量的H.265/HEVC视频隐写
几类具比例时滞的中立型微分方程解
空时分组码空间调制系统的码字优化
几类三点边值问题的解的存在性
三维视频深度信息的压缩编码研究
具非线性感染率和脉冲接种的传染病
分布式视频编码信源失真估计研究
几类肿瘤生长微分方程模型及其动力
针对最新一代编码标准HEVC的视频重
乙肝病毒的数学模型及定性分析
基于PU划分模式的HEVC转码重压缩检
非均匀扩散反应方程动力学性质及其
多路径并行传输环境下流媒体业务高
几类脉冲时滞微分方程解的定性研究
“魂芯”DSP H.265编码器帧内预测的
两类分数阶微分方程边值问题解的存
基于DASH技术的动态自适应算法研究
面向多模波导互连的多输入多输出传
基于HEVC的高效率视频编码优化研究
手机Miata 4G研发风险管理
无线信道建模技术的研究与应用
中国伪叶甲亚族分类研究(鞘翅目:
一种基于博弈论和跨层机制的卫星带
磁铁矿矿坑水细菌分离与多样性分析
基于安卓手机的动态虚拟听觉重放
基于无线网的空间目标定位与追踪算
小鼠睾丸特异性miR-471的表达及功能
基于改进遗传算法的水声MC-CDMA子载
CQM模型下介子的衰变
时变水声信道下基于频域均衡的双向
SO2第一激发带的光激发
激光诱导金属等离子体光谱特性研究
非自主AP室内定位方法及系统实现关
基于QoS的异构网络垂直切换网络选择
半方差风险准则与应用
基于LoRaTM传感器网络的
简约模糊变量的矩及其应用
认知车载自组网中协作频谱感知算法
 
说话人识别论文 GMM-UBM论文 因子分析论文 总体变化子空间论文 i-vector论文
版权申明:目录由用户jg**提供,www.51papers.com仅收录目录,作者需要删除这篇论文目录请点击这里
| 设为首页||加入收藏||站内搜索引擎||站点地图||在线购卡|
版权所有 教育论文网 Copyright(C) All Rights Reserved