教育论文网

改进的互信息与LDA结合的特征降维方法研究

硕士博士毕业论文站内搜索    
分类:教育论文网→工业技术论文→自动化技术、计算机技术论文计算技术、计算机技术论文计算机的应用论文信息处理(信息加工)论文文字信息处理论文
改进的互信息与LDA结合的特征降维方法研究
论文目录
 
摘要第1-6页
Abstract第6-10页
第一章 绪论第10-14页
  1.1 研究背景及意义第10-11页
    1.1.1 研究背景第10页
    1.1.2 研究意义第10-11页
  1.2 国内外研究现状第11-12页
  1.3 研究内容及主要工作第12-13页
  1.4 论文的组织结构第13-14页
第二章 相关技术概述第14-24页
  2.1 文本分类介绍与预处理第14-16页
    2.1.1 文本分类介绍第14-16页
    2.1.2 文本预处理第16页
  2.2 文本表示模型第16-17页
  2.3 文本特征选择方法第17-19页
    2.3.1 文档频数第17-18页
    2.3.2 信息增益第18页
    2.3.3 χ~2统计量第18-19页
    2.3.4 互信息第19页
  2.4 常用文本分类算法第19-21页
    2.4.1 朴素贝叶斯第19-20页
    2.4.2 支持向量机第20页
    2.4.3 KNN算法第20-21页
  2.5 文本分类评估指标第21-23页
    2.5.1 准确率和召回率第22页
    2.5.2 F值第22页
    2.5.3 宏平均和微平均第22-23页
  2.6 本章小结第23-24页
第三章 互信息特征选择方法改进第24-34页
  3.1 传统互信息特征选择第24-26页
    3.1.1 传统互信息特征选择方法第24-25页
    3.1.2 传统互信息特征选择方法不足第25-26页
  3.2 影响强信息特征的因素第26页
  3.3 特征词词频第26-27页
    3.3.1 特征类频度第26-27页
    3.3.2 特征类内文本平均次数第27页
    3.3.3 最小词频数第27页
  3.4 类别区分词第27-29页
    3.4.1 类内分散度第28页
    3.4.2 类间离散度第28-29页
  3.5 特征词词频与类别区分词结合的改进第29-30页
  3.6 实验结果与分析第30-33页
    3.6.1 实验语料预处理第30页
    3.6.2 KNN算法中K值确定第30-32页
    3.6.3 实验对比分析第32-33页
  3.7 本章小结第33-34页
第四章 特征选择与LDA相结合的分类实现第34-49页
  4.1 主题模型第34-36页
    4.1.1 PLSA模型第34-35页
    4.1.2 LDA模型第35-36页
  4.2 改进的互信息特征选择与LDA模型相结合第36-39页
    4.2.1 基本流程图第36-37页
    4.2.2 LDA模型初始参数设定第37-38页
    4.2.3 LDA模型的推断第38-39页
    4.2.4 特征选择与LDA相结合的分类过程第39页
  4.3 实验结果与分析第39-48页
    4.3.1 实验环境与工具第39-40页
    4.3.2 实验语料预处理第40-41页
    4.3.3 主题数的选取第41-42页
    4.3.4 LDA训练过程第42-43页
    4.3.5 实验对比分析第43-48页
  4.4 本章小结第48-49页
第五章 总结与展望第49-51页
  5.1 全文总结第49页
  5.2 研究展望第49-51页
参考文献第51-54页
在校期间发表的论文、科研成果第54-55页
致谢第55页

本篇论文共55页,点击这进入下载页面
 
更多论文
改进的互信息与LDA结合的特征降维方
汉语复句中基于语料统计的决策式依
基于关系词搭配的汉语复句依存关系
中文微博评论对象抽取研究
基于社交网络文本分析的短期股市行
基于微信公众号的文本分类研究
基于VSM模型和ILDA模型联合建模的新
基于Scrapy爬取电商平台数据及自动
面向移动互联网的文本分类技术应用
深度重启的Arnoldi加速的PageRank方
基于要素投影的事件本体形式化方法
基于深度学习的短信分类技术研究
分类学术文献搜索引擎的应用和研究
基于领域本体的客服问答系统的设计
基于社交网络信任度的协同过滤推荐
基于深度神经网络的统计机器翻译模
中文文本实体关系抽取方法研究
基于多语言模型融合的鲁棒手写后处
基于依存关系的语义表示方法研究
面向社会媒体的高校网络舆情分析系
基于分布式表示的汉语问答系统
微博情绪分类的关键技术研究
面向多通道爬虫的Web信息抽取技术研
基于深度学习的文本情感分析研究
面向中文文本的情感分析方法研究
基于内容的电子书和作者推荐方法研
基于情绪认知常识库的文本情绪原因
基于本体的健康知识库自动构建方法
基于分布式平台的个性化推荐系统研
长文本的复杂指标提取方法
基于递归神经网络的英文手写输入法
面向《大词林》的中文实体关系挖掘
融合外部知识的中文命名实体识别研
基于深度语义特征的情感分析研究
面向对话文本的主题分割技术研究
基于深度学习的问题分类的研究
微博用户兴趣识别技术的研究与应用
基于深度神经网络的文本蕴含识别及
基于深度学习的自然语言句法分析研
基于词向量和LSTM的汉语零指代消解
面向军事领域的命名实体识别及相关
基于中文电子病历的跨科室组块分析
基础语言类问题求解关键技术研究
评价对象识别模型与方法研究
中文电子病历实体关系抽取研究
基于Word2Vec的中文问句检索技术研
面向微博事件的民众情绪分类及原因
基于机器学习的微博评论信息倾向性
基于领域知识的自动答题方法研究
教育应用推荐与教学资讯分享平台的
面向语文作文自动评阅的修辞手法识
复合规则驱动聚焦爬虫系统的设计与
手机腾讯网新闻智能推荐系统的设计
基于多源数据融合的微博用户兴趣挖
基于在线适应的机器翻译后编辑研究
互联网信息存储检索优化及推荐技术
基于LSTM的英文文本蕴含识别方法研
面向问答的问句关键词提取技术研究
基于深度学习的中文电子病历实体修
基于跨语言映射的汉语语义知识自动
面向推荐的大数据计算与存储平台设
基于深度学习的中文代词消解及其在
面向URL的用户建模关键技术研究
信息技术自主可控政策对A银行的影响
区域商品导购信息数据交互设计研究
医疗信息化网络及安全策略的设计与
网络服务功能链拓扑设计及映射研究
信息中心网络缓存管理方法及流量工
基于SDN架构的网络接入控制功能的设
网络虚拟化平台的研究和应用开发
 
文本分类论文 改进互信息论文 LDA模型论文 特征降维论文
版权申明:目录由用户张**提供,www.51papers.com仅收录目录,作者需要删除这篇论文目录请点击这里
| 设为首页||加入收藏||站内搜索引擎||站点地图||在线购卡|
版权所有 教育论文网 Copyright(C) All Rights Reserved