教育论文网

基于内存计算的文本聚类算法的研究与实现

硕士博士毕业论文站内搜索    
分类:教育论文网→工业技术论文→自动化技术、计算机技术论文计算技术、计算机技术论文计算机的应用论文信息处理(信息加工)论文文字信息处理论文
基于内存计算的文本聚类算法的研究与实现
论文目录
 
摘要第1-5页
Abstract第5-11页
缩略语第11-12页
第一章 绪论第12-16页
  1.1 引言第12页
  1.2 课题背景第12-13页
    1.2.1 新闻推荐系统框架第13页
  1.3 论文的研究目的和意义第13-14页
  1.4 论文的研究内容及章节安排第14-16页
第二章 个性化推荐系统技术综述第16-24页
  2.1 个性化推荐系统概述第16页
  2.2 个性化推荐系统分类第16-21页
    2.2.1 基于协同过滤的推荐第16-17页
    2.2.2 基于内容的推荐第17-18页
    2.2.3 基于关联规则的推荐第18-19页
    2.2.4 基于效用的推荐第19页
    2.2.5 基于知识的推荐第19页
    2.2.6 混合推荐系统第19-21页
  2.3 本章小节第21-24页
第三章 网络爬虫的研究与实现第24-44页
  3.1 搜索引擎概述第24-27页
  3.2 网络爬虫分类与工作原理第27-29页
    3.2.1 网络爬虫的分类第27-28页
    3.2.2 网络爬虫的工作原理第28-29页
  3.3 网络爬虫搜索策略第29-30页
    3.3.1 广度优先搜索策略第29页
    3.3.2 深度优先搜索策略第29页
    3.3.3 搜索策略比较第29-30页
  3.4 爬虫架构第30-31页
  3.5 网页去重概述第31-33页
    3.5.1 网页重复的原因第32页
    3.5.2 网页重复的类型第32页
    3.5.3 网页去重的意义第32-33页
  3.6 现有网页去重算法第33-37页
    3.6.1 基于I-Match的网页去重算法第34页
    3.6.2 基于Shingling的网页去重算法第34-35页
    3.6.3 基于LSH的网页去重算法第35-36页
    3.6.4 基于布隆过滤器的网页去重算法第36-37页
  3.7 基于布隆过滤器和标题的网页去重算法第37-41页
    3.7.1 布隆过滤器算法描述第37-38页
    3.7.2 布隆过滤器时间和空间上的优势第38页
    3.7.3 误判概率的证明和计算第38-39页
    3.7.4 设计和应用布隆过滤器第39-40页
    3.7.5 基于标题的网页去重第40-41页
  3.8 实验与分析第41-42页
  3.9 本章小节第42-44页
第四章 基于统计与标题和正文位置关系的正文提取算法的研究与实现第44-58页
  4.1 网页正文提取概述第44-45页
  4.2 现有网页正文提取算法第45-49页
    4.2.1 基于模板的正文提取算法第45页
    4.2.2 基于视觉的正文提取算法第45-46页
    4.2.3 基于机器学习的正文提取算法第46-48页
    4.2.4 基于统计的正文提取算法第48-49页
  4.3 基于统计与标题和正文位置关系的正文提取算法第49-53页
    4.3.1 混合提取模型第49-50页
    4.3.2 算法详细描述第50-53页
  4.4 实验与分析第53-56页
  4.5 本章小节第56-58页
第五章 个性化新闻推荐引擎中新闻聚类系统的实现第58-68页
  5.1 聚类算法概述第58-60页
    5.1.1 K-Means算法介绍第58-59页
    5.1.2 文本聚类介绍第59-60页
  5.2 新闻聚类系统的设计第60-64页
    5.2.1 新闻源的获取第60页
    5.2.2 正文的提取第60-61页
    5.2.3 中文分词第61页
    5.2.4 文本特征表示第61-62页
    5.2.5 分布式处理架构第62-63页
    5.2.6 新闻聚类系统第63-64页
  5.3 实验与分析第64-67页
  5.4 本章小节第67-68页
第六章 总结与展望第68-70页
  6.1 全文总结第68-69页
  6.2 进一步研究工作第69-70页
致谢第70-72页
参考文献第72-76页
攻读硕士学位期间的研究成果第76页

本篇论文共76页,点击这进入下载页面
 
更多论文
基于内存计算的文本聚类算法的研究
城市地下空间灾害事故综合管理对策
本体演化系统的研究与实现
基于微博的情感分析关键技术研究
视频垂直搜索引擎中信息抽取与存储
宝钢大方坯连铸过程机国产化项目管
面向垂直搜索的网络爬虫设计与实现
基于RCM的高炉设备维修工程与实例
基于web用户体验的推荐系统设计与实
转子轮槽铣削加工刀具状态在线监控
面向用户个性化推荐的日志分析系统
面向事件的微博情感倾向性分析技术
铅酸蓄电池电极铸焊工艺研究
复杂结构精确Web信息抽取规则语言与
基于上下文的虚拟终端系统及ITS应用
基于Hadoop的并行混合推荐算法及工
冷板真空钎焊质量控制系统研究
基于用户信任网络和偏好的Web服务推
国产船用钢板高功率CO2
协同化移动流媒体系统中时空感知的
基于用户交互的半监督式Web信息抽取
面向异构社交网络的个性化推荐技术
稀疏化模型及其在文本分类中的应用
镁及镁合金表面熔盐扩散富铝涂层的
基于自然语言处理的图像情感语义检
不锈钢冷带退火酸洗的工艺及设备的
禁位排列路由决策算法的研究及应用
硫化物对中碳非调质钢组织的影响
基于流量感知的动态自适应协同能效
力、电作用下的Coble蠕变
机会网络中的链路预测和路由策略研
煤层气液化流程中原料气吸附预处理
双重网络中考虑能力有限的个体的合
周期性纳米结构金属薄膜中光的传输
基于机会网络的室内移动目标导航机
含碳纳米管新型宽频轻质电磁屏蔽材
基于预算受限的网格工作流调度算法
小尺度效应下碳纳米管的动态稳定性
基于AS间合作关系的互联网层次结构
基于速度缩放与休眠唤醒策略的网络
基于地理位置的网络加权化社团发现
基于动态数据分析的机会性内容分发
自治系统内SDN子网与IP子网互连机制
因特网拓扑及其关键技术研究
基于NDN的路由可扩展性研究与实现
基于mSCTP-CMT的切换策略优化研究
多路径并行传输算法的设计与实现
有线和无线网络环境下SCTP丢包区分
基于TCAM的OpenFlow关键技术研究
IRF的二层转发机制的实现
快速路由迭代方法的实现及性能优化
OpenFlow网络中组播机制的研究
双结构网络中内容协同分发网关的存
基于分布相似度迁移的关键路由设备
基于滑模控制的TCP网络主动队列管理
基于T-S模糊模型的TCP网络拥塞控制
基于哈密顿理论的TCP网络拥塞控制研
基于带宽约束模型的带宽自治及其算
基于OpenFlow技术的流量分发管理系
基于DFI流量分类技术研究与实现
互联网流量综合处理平台的研究与实
开放式可重构监控系统设计与实现
接入传输网络设备中ITU-T Y.1564测
分布式系统业务通道检测的研究与实
基于实测流量的丢包率研究
异构网络测试床拓扑映射算法研究
网络流量特征分析与特征选择
基于网络质量评价的视频源选择系统
基于混合方法的网络流量分类技术研
用于入侵取证的大规模取证日志自动
网络安全与国家主权:互联网自由的
网络安全关键策略及教学模拟攻防系
基于数据不可信的缓冲区溢出攻击检
基于信任及风险的访问控制模型研究
自治化信任管理系统研究
信息中心网络路由算法的设计与仿真
Web输入验证脆弱性检测方法研究与改
基于浏览器扩展的Drive-by downloa
虚拟机防火墙系统的设计与实现
 
新闻聚类论文 网络爬虫论文 网页去重论文 正文提取论文 分布式系统论文 K-Means算法论文
版权申明:目录由用户胡**提供,www.51papers.com仅收录目录,作者需要删除这篇论文目录请点击这里
| 设为首页||加入收藏||站内搜索引擎||站点地图||在线购卡|
版权所有 教育论文网 Copyright(C) All Rights Reserved