教育论文网

文本宏特征抽取与基于质心的自动分类方法研究

硕士博士毕业论文站内搜索    
分类:教育论文网→工业技术论文→自动化技术、计算机技术论文计算技术、计算机技术论文计算机的应用论文信息处理(信息加工)论文文字信息处理论文
文本宏特征抽取与基于质心的自动分类方法研究
论文目录
 
摘要第1-6页
ABSTRACT第6-14页
第1章 绪论第14-29页
  1.1 课题背景及意义第14-16页
  1.2 文本分类语料库的构建方法研究第16-18页
  1.3 文本特征抽取研究现状第18-20页
  1.4 文本分类方法研究现状第20-24页
    1.4.1 无监督文本分类方法第20-21页
    1.4.2 有监督文本分类方法第21-22页
    1.4.3 半监督文本分类方法第22-24页
  1.5 文本分类评测指标第24-25页
  1.6 本文的研究内容及创新点第25-27页
    1.6.1 研究内容概述第25-27页
    1.6.2 主要创新点第27页
  1.7 论文组织结构第27-29页
第2章 基于网页结构的语料库自动构建方法第29-51页
  2.1 引言第29-30页
  2.2 语料库自动构建方法框架第30-31页
  2.3 网页类别自动标注方法第31-39页
    2.3.1 导航栏识别过程第32-33页
    2.3.2 导航栏识别方法第33-38页
    2.3.3 链接类别自动标注方法第38-39页
  2.4 语料库生成第39-41页
    2.4.1 网页内容提取第39-40页
    2.4.2 网页语言分类第40-41页
  2.5 基于文本聚类的语料库降噪第41-44页
    2.5.1 基于K-means聚类的语料库降噪第42页
    2.5.2 基于LDA主题模型的语料库降噪第42-44页
  2.6 实验第44-50页
    2.6.1 实验数据第44页
    2.6.2 实验设置第44-45页
    2.6.3 实验结果第45-50页
  2.7 本章小结第50-51页
第3章 有监督文本宏特征抽取方法第51-73页
  3.1 引言第51-52页
  3.2 文本聚类算法第52-54页
    3.2.1 K-means聚类算法第52-53页
    3.2.2 层次聚类算法第53页
    3.2.3 AP聚类算法第53-54页
  3.3 距离函数和相似度度量方法第54-56页
    3.3.1 距离函数第54-55页
    3.3.2 相似度度量方法第55-56页
  3.4 基于聚类的有监督宏特征抽取第56-58页
    3.4.1 基于聚类的有监督宏特征抽取原理第56-57页
    3.4.2 基于聚类的有监督宏特征抽取算法第57-58页
  3.5 基于聚类加权的有监督宏特征抽取第58-62页
    3.5.1 基于聚类加权的有监督宏特征抽取原理第58-60页
    3.5.2 基于聚类加权的有监督宏特征抽取算法第60-62页
  3.6 基于质心向量的有监督宏特征抽取第62-64页
    3.6.1 基于质心向量的有监督宏特征抽取原理第62页
    3.6.2 基于质心向量的有监督宏特征抽取算法第62-64页
  3.7 实验第64-72页
    3.7.1 实验数据第64页
    3.7.2 实验设置第64-65页
    3.7.3 实验结果第65-72页
  3.8 本章小结第72-73页
第4章 文本宏特征融合方法第73-84页
  4.1 引言第73页
  4.2 文本的描述模型第73-74页
  4.3 无监督宏特征第74-77页
    4.3.1 基于K-means的无监督宏特征抽取第74页
    4.3.2 基于LDA的无监督宏特征抽取第74-76页
    4.3.3 基于DBN的无监督宏特征抽取第76-77页
  4.4 有监督和无监督宏特征融合第77-79页
  4.5 实验第79-83页
    4.5.1 实验数据和设置第79页
    4.5.2 实验结果第79-83页
  4.6 本章小结第83-84页
第5章 基于排序学习框架的质心文本分类方法第84-105页
  5.1 引言第84-85页
  5.2 基于质心的分类方法第85-87页
    5.2.1 Rocchio方法第85-86页
    5.2.2 Hypothesis Margin Centroid方法第86页
    5.2.3 Drag Pushing方法第86-87页
  5.3 基于排序学习的质心分类方法的统一框架第87-90页
    5.3.1 基于排序学习的统一框架第87-88页
    5.3.2 基于质心的分类方法的框架表示第88-90页
  5.4 基于排序学习的质心分类方法第90-96页
    5.4.1 基于Pointwise排序的质心方法第90-92页
    5.4.2 基于Pairwise排序的质心方法第92-94页
    5.4.3 基于Listwise排序的质心方法第94-96页
  5.5 实验第96-104页
    5.5.1 实验数据第96-97页
    5.5.2 实验设置第97-98页
    5.5.3 实验结果第98-104页
  5.6 本章小结第104-105页
结论第105-107页
参考文献第107-119页
攻读博士学位期间发表的学术论文及其它成果第119-121页
致谢第121-122页
个人简历第122页

本篇论文共122页,点击这进入下载页面
 
更多论文
文本宏特征抽取与基于质心的自动分
面向社会化媒体的用户生成内容推荐
社会化用户模型研究及其在推荐系统
面向公安业务的视频结构化描述研究
TMC空间光学系统波前编码技术研究
基于局部特征的图像配准算法及应用
城市景观照明企业品牌营销策划报告
针对视频中移动目标检测的背景建模
家具企业创知名品牌研究——以WY家
多摄像机下的目标检测、跟踪与识别
制药企业客户价值评价研究
基于结构光的三维感知系统关键问题
摩托罗拉刀锋系列产品营销策略研究
多边触觉遥操作系统绝对稳定性研究
快递行业网购顾客忠诚影响因素的实
我国房地产上市公司股权结构与股利
MDA框架下基于语义保持的大粒度模型
企业通过资产减值进行盈余管理的实
移动环境角色权限机制改进
创业板上市公司IPO效应实证研究
嵌入式实时系统节能和可靠性优化算
中国新材料产业创业投资的风险研究
中国企业对赌协议的动机和经济后果
同时同频全双工自干扰信道测量与特
“十二五”期间国有控股上市企业股
弹载合成孔径雷达干扰技术研究
“万福生科”财务造假案引发的会计
正交波形MIMO雷达射频隐身技术研究
作业成本法在公交保修企业的应用研
MIMO-OTH雷达参数估计与干扰抑制研
建筑施工企业集团BT项目会计核算研
MIMO雷达杂波抑制与信号积累补偿研
企业终止经营业务的会计难题与对策
财务重述对上市公司股权资本成本影
基于发射波形设计与自适应接收处理
金融类上市公司股权结构与现金股利
太赫兹雷达成像算法研究
财务信息披露质量与股权资本成本的
高分辨率宽测绘带合成孔径雷达成像
新能源汽车上市公司财务竞争力评价
房地产上市公司评估结果增值度研究
宽带数字阵列雷达关键技术研究
我国中小型企业内部控制问题研究
基于分数阶傅里叶域稀疏表征的CS-S
U集团财务管控问题及对策研究
雷达通信一体化波形研究
上市公司会计稳健性与过度投资行为
低轨卫星高动态通信链路同步技术研
内部控制信息披露质量对盈余管理的
认知无线电动态频谱接入关键技术研
我国家族上市公司与国有上市公司股
提高无线机会性网络编码性能增益机
无线传感器网络路由安全关键技术研
基于属性的密码技术研究
我国核电上市公司社会责任会计信息
单天线接收时频混叠数字通信信号分
股权集中度与经营绩效基于中部地区
多载波通信系统中基于基扩展模型的
我国核电行业社会责任会计指数研究
稀疏阵列综合及DOA估计方法的研究
基于生存分析理论的上市公司财务危
宽带信号频谱分析关键技术研究及系
上市医药制造企业财务战略绩效评价
空时四维天线阵理论与应用基础研究
机构投资者持股与上市公司盈余管理
中国三大经济圈上市民企财务绩效比
MIMO通信应用中的天线技术与理论研
基于高低频混合方法的区域分解算法
科技投入视角下衡阳市高新技术产业
TIADC系统校准算法研究与实现
湖北养生旅游的开发研究——基于传
基于相量分析的模拟电路故障诊断方
北京婚庆旅游市场营销策略研究
基于互补开环谐振器和向列型液晶微
龙湾旅游市场策划方案
新型微波毫米波器件关键技术研究
基于GSTE中抽象问题的研究及其应用
氧化物薄膜晶体管的制备与物性研究
背沟道刻蚀型氧化物薄膜晶体管的研
新型亚微/纳米电极及其光电器件界面
高光效硅衬底GaN基大功率绿光LED研
周期结构的衍射模拟算法及其应用研
微波时间反演系统及其关键技术研究
《白虎通疏證》研究
社区应急管理人员的信息需求研究—
1978-2011:中国广电传媒改革路径研
“共和”中的政治报——以“竖三民
中国海洋意识建构的大众传播策略研
《人民日报》(1950-2014)少数民族
带权信息网络之计量测度研究
中国网络行动的动因、过程与影响
媒介时间论:信息社会经验下的媒介
公共决策中的媒介参与研究
 
文本分类论文 语料库自动构建论文 文本特征抽取论文 宏特征抽取论文 质心分类论文
版权申明:目录由用户无忧**提供,www.51papers.com仅收录目录,作者需要删除这篇论文目录请点击这里
| 设为首页||加入收藏||站内搜索引擎||站点地图||在线购卡|
版权所有 教育论文网 Copyright(C) All Rights Reserved