载入中...
改进的互信息与LDA结合的特征降维方法研究
硕士博士毕业论文站内搜索
全站论文库
硕士博士论文库
普通期刊论文库
分类:
教育论文网
→工业技术论文→
自动化技术、计算机技术论文
→
计算技术、计算机技术论文
→
计算机的应用论文
→
信息处理(信息加工)论文
→
文字信息处理论文
改进的互信息与LDA结合的特征降维方法研究
论文目录
摘要
第1-6页
Abstract
第6-10页
第一章 绪论
第10-14页
1.1 研究背景及意义
第10-11页
1.1.1 研究背景
第10页
1.1.2 研究意义
第10-11页
1.2 国内外研究现状
第11-12页
1.3 研究内容及主要工作
第12-13页
1.4 论文的组织结构
第13-14页
第二章 相关技术概述
第14-24页
2.1 文本分类介绍与预处理
第14-16页
2.1.1 文本分类介绍
第14-16页
2.1.2 文本预处理
第16页
2.2 文本表示模型
第16-17页
2.3 文本特征选择方法
第17-19页
2.3.1 文档频数
第17-18页
2.3.2 信息增益
第18页
2.3.3 χ~2统计量
第18-19页
2.3.4 互信息
第19页
2.4 常用文本分类算法
第19-21页
2.4.1 朴素贝叶斯
第19-20页
2.4.2 支持向量机
第20页
2.4.3 KNN算法
第20-21页
2.5 文本分类评估指标
第21-23页
2.5.1 准确率和召回率
第22页
2.5.2 F值
第22页
2.5.3 宏平均和微平均
第22-23页
2.6 本章小结
第23-24页
第三章 互信息特征选择方法改进
第24-34页
3.1 传统互信息特征选择
第24-26页
3.1.1 传统互信息特征选择方法
第24-25页
3.1.2 传统互信息特征选择方法不足
第25-26页
3.2 影响强信息特征的因素
第26页
3.3 特征词词频
第26-27页
3.3.1 特征类频度
第26-27页
3.3.2 特征类内文本平均次数
第27页
3.3.3 最小词频数
第27页
3.4 类别区分词
第27-29页
3.4.1 类内分散度
第28页
3.4.2 类间离散度
第28-29页
3.5 特征词词频与类别区分词结合的改进
第29-30页
3.6 实验结果与分析
第30-33页
3.6.1 实验语料预处理
第30页
3.6.2 KNN算法中K值确定
第30-32页
3.6.3 实验对比分析
第32-33页
3.7 本章小结
第33-34页
第四章 特征选择与LDA相结合的分类实现
第34-49页
4.1 主题模型
第34-36页
4.1.1 PLSA模型
第34-35页
4.1.2 LDA模型
第35-36页
4.2 改进的互信息特征选择与LDA模型相结合
第36-39页
4.2.1 基本流程图
第36-37页
4.2.2 LDA模型初始参数设定
第37-38页
4.2.3 LDA模型的推断
第38-39页
4.2.4 特征选择与LDA相结合的分类过程
第39页
4.3 实验结果与分析
第39-48页
4.3.1 实验环境与工具
第39-40页
4.3.2 实验语料预处理
第40-41页
4.3.3 主题数的选取
第41-42页
4.3.4 LDA训练过程
第42-43页
4.3.5 实验对比分析
第43-48页
4.4 本章小结
第48-49页
第五章 总结与展望
第49-51页
5.1 全文总结
第49页
5.2 研究展望
第49-51页
参考文献
第51-54页
在校期间发表的论文、科研成果
第54-55页
致谢
第55页
本篇论文共
55
页,
点击这进入下载页面
。
更多论文
改进的互信息与LDA结合的特征降维方
汉语复句中基于语料统计的决策式依
基于关系词搭配的汉语复句依存关系
中文微博评论对象抽取研究
基于社交网络文本分析的短期股市行
基于微信公众号的文本分类研究
基于VSM模型和ILDA模型联合建模的新
基于Scrapy爬取电商平台数据及自动
面向移动互联网的文本分类技术应用
深度重启的Arnoldi加速的PageRank方
基于要素投影的事件本体形式化方法
基于深度学习的短信分类技术研究
分类学术文献搜索引擎的应用和研究
基于领域本体的客服问答系统的设计
基于社交网络信任度的协同过滤推荐
基于深度神经网络的统计机器翻译模
中文文本实体关系抽取方法研究
基于多语言模型融合的鲁棒手写后处
基于依存关系的语义表示方法研究
面向社会媒体的高校网络舆情分析系
基于分布式表示的汉语问答系统
微博情绪分类的关键技术研究
面向多通道爬虫的Web信息抽取技术研
基于深度学习的文本情感分析研究
面向中文文本的情感分析方法研究
基于内容的电子书和作者推荐方法研
基于情绪认知常识库的文本情绪原因
基于本体的健康知识库自动构建方法
基于分布式平台的个性化推荐系统研
长文本的复杂指标提取方法
基于递归神经网络的英文手写输入法
面向《大词林》的中文实体关系挖掘
融合外部知识的中文命名实体识别研
基于深度语义特征的情感分析研究
面向对话文本的主题分割技术研究
基于深度学习的问题分类的研究
微博用户兴趣识别技术的研究与应用
基于深度神经网络的文本蕴含识别及
基于深度学习的自然语言句法分析研
基于词向量和LSTM的汉语零指代消解
面向军事领域的命名实体识别及相关
基于中文电子病历的跨科室组块分析
基础语言类问题求解关键技术研究
评价对象识别模型与方法研究
中文电子病历实体关系抽取研究
基于Word2Vec的中文问句检索技术研
面向微博事件的民众情绪分类及原因
基于机器学习的微博评论信息倾向性
基于领域知识的自动答题方法研究
教育应用推荐与教学资讯分享平台的
面向语文作文自动评阅的修辞手法识
复合规则驱动聚焦爬虫系统的设计与
手机腾讯网新闻智能推荐系统的设计
基于多源数据融合的微博用户兴趣挖
基于在线适应的机器翻译后编辑研究
互联网信息存储检索优化及推荐技术
基于LSTM的英文文本蕴含识别方法研
面向问答的问句关键词提取技术研究
基于深度学习的中文电子病历实体修
基于跨语言映射的汉语语义知识自动
面向推荐的大数据计算与存储平台设
基于深度学习的中文代词消解及其在
面向URL的用户建模关键技术研究
信息技术自主可控政策对A银行的影响
区域商品导购信息数据交互设计研究
医疗信息化网络及安全策略的设计与
网络服务功能链拓扑设计及映射研究
信息中心网络缓存管理方法及流量工
基于SDN架构的网络接入控制功能的设
网络虚拟化平台的研究和应用开发
文本分类论文
改进互信息论文
LDA模型论文
特征降维论文
版权申明
:目录由用户
张**
提供,
www.51papers.com
仅收录目录,作者需要删除这篇论文目录
请点击这里
。
|
设为首页
||
加入收藏
||
站内搜索引擎
||
站点地图
||
在线购卡
|
版权所有
教育论文网
Copyright(C) All Rights Reserved