教育论文网

深度学习在音乐自动标注中的应用

硕士博士毕业论文站内搜索    
分类:教育论文网→工业技术论文→无线电电子学、电信技术论文通信论文电声技术和语音信号处理论文语音信号处理论文
深度学习在音乐自动标注中的应用
论文目录
 
致谢第1-6页
摘要第6-7页
ABSTRACT第7-11页
缩略词表第11-12页
1 引言第12-19页
  1.1 研究背景第12-13页
    1.1.1 音乐标注基本概念第12-13页
    1.1.2 深度学习第13页
  1.2 国内外研究现状第13-18页
    1.2.1 传统的音乐标注方式第13-15页
    1.2.2 音频特征提取第15页
    1.2.3 深度学习在音乐领域的应用第15-17页
    1.2.4 深度学习在音乐标注领域的应用第17-18页
  1.3 本文重点研究内容第18页
  1.4 论文结构安排第18-19页
2 相关技术介绍第19-35页
  2.1 音频信号特征表达第19-22页
    2.1.1 梅尔倒谱系数第19-20页
    2.1.2 频谱图第20-22页
  2.2 深度学习第22-34页
    2.2.1 卷积神经网络第22-26页
    2.2.2 优化方法第26-33页
    2.2.3 正则化第33-34页
  2.3 本章小结第34-35页
3 模型结构设计和平台搭建第35-46页
  3.1 数据集第35页
  3.2 问题描述第35-36页
  3.3 模型设计思路第36-38页
    3.3.1 输入信号第36-37页
    3.3.2 卷积层窗口和轴第37页
    3.3.3 池化层的大小和轴第37-38页
    3.3.4 损失函数定义第38页
  3.4 模型结构第38-42页
    3.4.1 梅尔频谱系数模型第38-39页
    3.4.2 频谱图模型第39-41页
    3.4.3 原始音频模型第41-42页
  3.5 深度学习平台搭建第42-45页
    3.5.1 深度学习平台第42-44页
    3.5.2 软件安装第44-45页
    3.5.3 硬件第45页
  3.6 本章小结第45-46页
4 实验结果和讨论第46-58页
  4.1 模型训练以及收敛的细节第46-52页
    4.1.1 不同训练速率对于训练收敛过程的影响第46-49页
    4.1.2 不同梯度下降方法对于训练速度的影响第49-52页
  4.2 模型表现的对比第52-56页
    4.2.1 不同模型的对比第53-55页
    4.2.2 与相关工作的对比第55-56页
  4.3 不同深度的模型在MSD上的表现第56-57页
  4.4 本章小结第57-58页
5 卷积神经网络可视化第58-62页
  5.1 模型可视化的思路第58页
  5.2 卷积神经网络可视化的一般模型结构第58页
  5.3 可视化模型的损失函数定义第58-59页
  5.4 可视化模型的训练方式第59-60页
  5.5 梅尔频谱图模型的可视化效果第60-62页
6 结论和展望第62-63页
参考文献第63-66页
作者简历及攻读硕士/博士学位期间取得的研究成果第66-68页
学位论文数据集第68页

本篇论文共68页,点击这进入下载页面
 
更多论文
深度学习在音乐自动标注中的应用
语音合成中韵律结构预测改进——深
三杆张拉整体结构扭转角度及拓扑分
基于语音端点检测的移动设备无障碍
薄壁加筋圆柱壳静动力屈曲特性数值
基于Android的智能音响系统的设计与
改进的复模态理论及其在随机振动领
基于卷积神经网络的语音识别研究
基于流形学习的语音特征提取研究
基于整体位移模式的平面间断弹性结
基于语音识别的智能WIFI音箱
频变非线性动力系统辨识方法的理论
新型互联网组播协议一致性测试的设
基于MIDAS族模型的人民币汇率预测研
文物环境监控系统通信网关的设计与
物理网络芯片与FPGA结合的向量网交
基于CPU-GPU异构平台的粒子输运方程
提高下一代光接入网可靠性的关键技
共轭梯度方法在CPU+GPU架构上的性能
带多重右边的不定最小二乘问题的条
基于RDMA跨态通信协议的研究与实现
VDSL2系统关键技术的实现方法及MAT
群零模正则化问题的多阶段凸松弛法
应用于高速串行通信的部分响应均衡
关于二次规划算法的研究
S波段快速跳频源设计
基于数字证书的加密网络电话的设计
稀疏主成分分析的相关研究
基于ARM平台Linux系统的嵌入式传真
基于CD的水平置换方法构造混合水平
基于W态的无线蜂窝结构量子通信网络
自正则化随机和的鞍点近似
多小区组播系统中物理层安全传输技
匿名基于身份广播加密研究
倒向随机微分方程的保险定价方法
基于窃听信道模型的保密传输设计与
部分线性模型在税收分析和预测中的
考虑统计矩随机性的改进最大熵方法
跳跃式自缩序列模型设计及性质分析
D类独立随机变量加权和的大偏差理论
基于Hash函数和动态共享密钥的强匿
Panel数据模型的PB检验
基于NI USRP-RIO的MIMO-OFDM系统物
基于FPGA的低延迟数据传输设计
Beta-变换动力系统中攀援集和dista
Massive MIMO系统能效优化关键技术
由真映射生成的自由半群作用的拓扑
大规模MIMO系统中基于天线分组技术
C~1平均共形双曲不变集的维数
高级视频编码中运动估计的算法改进
单位球面中具有常平均曲率闭超曲面
H.264视频解码器宏块级并行实现与调
编码树单元预测划分和环路滤波的数
关于Zygmund向量场的拟对称流的一些
大规模蜂窝网络中可伸缩视频流多播
具有变H(?)rmander核的奇异积分算子
视频流客户端码率自适应调节策略研
基于GPU的HEVC并行帧内编码机制研究
Hua型算子矩阵的研究
基于多路径的鲁棒网络通信方法
基于光纤传输信号下IP多媒体子系统
几类非线性映象不动点与耦合不动点
 
深度学习论文 音乐 自动标记论文
版权申明:目录由用户qy2003**提供,www.51papers.com仅收录目录,作者需要删除这篇论文目录请点击这里
| 设为首页||加入收藏||站内搜索引擎||站点地图||在线购卡|
版权所有 教育论文网 Copyright(C) All Rights Reserved