载入中...
基于内存计算的文本聚类算法的研究与实现
硕士博士毕业论文站内搜索
全站论文库
硕士博士论文库
普通期刊论文库
分类:
教育论文网
→工业技术论文→
自动化技术、计算机技术论文
→
计算技术、计算机技术论文
→
计算机的应用论文
→
信息处理(信息加工)论文
→
文字信息处理论文
基于内存计算的文本聚类算法的研究与实现
论文目录
摘要
第1-5页
Abstract
第5-11页
缩略语
第11-12页
第一章 绪论
第12-16页
1.1 引言
第12页
1.2 课题背景
第12-13页
1.2.1 新闻推荐系统框架
第13页
1.3 论文的研究目的和意义
第13-14页
1.4 论文的研究内容及章节安排
第14-16页
第二章 个性化推荐系统技术综述
第16-24页
2.1 个性化推荐系统概述
第16页
2.2 个性化推荐系统分类
第16-21页
2.2.1 基于协同过滤的推荐
第16-17页
2.2.2 基于内容的推荐
第17-18页
2.2.3 基于关联规则的推荐
第18-19页
2.2.4 基于效用的推荐
第19页
2.2.5 基于知识的推荐
第19页
2.2.6 混合推荐系统
第19-21页
2.3 本章小节
第21-24页
第三章 网络爬虫的研究与实现
第24-44页
3.1 搜索引擎概述
第24-27页
3.2 网络爬虫分类与工作原理
第27-29页
3.2.1 网络爬虫的分类
第27-28页
3.2.2 网络爬虫的工作原理
第28-29页
3.3 网络爬虫搜索策略
第29-30页
3.3.1 广度优先搜索策略
第29页
3.3.2 深度优先搜索策略
第29页
3.3.3 搜索策略比较
第29-30页
3.4 爬虫架构
第30-31页
3.5 网页去重概述
第31-33页
3.5.1 网页重复的原因
第32页
3.5.2 网页重复的类型
第32页
3.5.3 网页去重的意义
第32-33页
3.6 现有网页去重算法
第33-37页
3.6.1 基于I-Match的网页去重算法
第34页
3.6.2 基于Shingling的网页去重算法
第34-35页
3.6.3 基于LSH的网页去重算法
第35-36页
3.6.4 基于布隆过滤器的网页去重算法
第36-37页
3.7 基于布隆过滤器和标题的网页去重算法
第37-41页
3.7.1 布隆过滤器算法描述
第37-38页
3.7.2 布隆过滤器时间和空间上的优势
第38页
3.7.3 误判概率的证明和计算
第38-39页
3.7.4 设计和应用布隆过滤器
第39-40页
3.7.5 基于标题的网页去重
第40-41页
3.8 实验与分析
第41-42页
3.9 本章小节
第42-44页
第四章 基于统计与标题和正文位置关系的正文提取算法的研究与实现
第44-58页
4.1 网页正文提取概述
第44-45页
4.2 现有网页正文提取算法
第45-49页
4.2.1 基于模板的正文提取算法
第45页
4.2.2 基于视觉的正文提取算法
第45-46页
4.2.3 基于机器学习的正文提取算法
第46-48页
4.2.4 基于统计的正文提取算法
第48-49页
4.3 基于统计与标题和正文位置关系的正文提取算法
第49-53页
4.3.1 混合提取模型
第49-50页
4.3.2 算法详细描述
第50-53页
4.4 实验与分析
第53-56页
4.5 本章小节
第56-58页
第五章 个性化新闻推荐引擎中新闻聚类系统的实现
第58-68页
5.1 聚类算法概述
第58-60页
5.1.1 K-Means算法介绍
第58-59页
5.1.2 文本聚类介绍
第59-60页
5.2 新闻聚类系统的设计
第60-64页
5.2.1 新闻源的获取
第60页
5.2.2 正文的提取
第60-61页
5.2.3 中文分词
第61页
5.2.4 文本特征表示
第61-62页
5.2.5 分布式处理架构
第62-63页
5.2.6 新闻聚类系统
第63-64页
5.3 实验与分析
第64-67页
5.4 本章小节
第67-68页
第六章 总结与展望
第68-70页
6.1 全文总结
第68-69页
6.2 进一步研究工作
第69-70页
致谢
第70-72页
参考文献
第72-76页
攻读硕士学位期间的研究成果
第76页
本篇论文共
76
页,
点击这进入下载页面
。
更多论文
基于内存计算的文本聚类算法的研究
城市地下空间灾害事故综合管理对策
本体演化系统的研究与实现
基于微博的情感分析关键技术研究
视频垂直搜索引擎中信息抽取与存储
宝钢大方坯连铸过程机国产化项目管
面向垂直搜索的网络爬虫设计与实现
基于RCM的高炉设备维修工程与实例
基于web用户体验的推荐系统设计与实
转子轮槽铣削加工刀具状态在线监控
面向用户个性化推荐的日志分析系统
面向事件的微博情感倾向性分析技术
铅酸蓄电池电极铸焊工艺研究
复杂结构精确Web信息抽取规则语言与
基于上下文的虚拟终端系统及ITS应用
基于Hadoop的并行混合推荐算法及工
冷板真空钎焊质量控制系统研究
基于用户信任网络和偏好的Web服务推
国产船用钢板高功率CO
2
协同化移动流媒体系统中时空感知的
基于用户交互的半监督式Web信息抽取
面向异构社交网络的个性化推荐技术
稀疏化模型及其在文本分类中的应用
镁及镁合金表面熔盐扩散富铝涂层的
基于自然语言处理的图像情感语义检
不锈钢冷带退火酸洗的工艺及设备的
禁位排列路由决策算法的研究及应用
硫化物对中碳非调质钢组织的影响
基于流量感知的动态自适应协同能效
力、电作用下的Coble蠕变
机会网络中的链路预测和路由策略研
煤层气液化流程中原料气吸附预处理
双重网络中考虑能力有限的个体的合
周期性纳米结构金属薄膜中光的传输
基于机会网络的室内移动目标导航机
含碳纳米管新型宽频轻质电磁屏蔽材
基于预算受限的网格工作流调度算法
小尺度效应下碳纳米管的动态稳定性
基于AS间合作关系的互联网层次结构
基于速度缩放与休眠唤醒策略的网络
基于地理位置的网络加权化社团发现
基于动态数据分析的机会性内容分发
自治系统内SDN子网与IP子网互连机制
因特网拓扑及其关键技术研究
基于NDN的路由可扩展性研究与实现
基于mSCTP-CMT的切换策略优化研究
多路径并行传输算法的设计与实现
有线和无线网络环境下SCTP丢包区分
基于TCAM的OpenFlow关键技术研究
IRF的二层转发机制的实现
快速路由迭代方法的实现及性能优化
OpenFlow网络中组播机制的研究
双结构网络中内容协同分发网关的存
基于分布相似度迁移的关键路由设备
基于滑模控制的TCP网络主动队列管理
基于T-S模糊模型的TCP网络拥塞控制
基于哈密顿理论的TCP网络拥塞控制研
基于带宽约束模型的带宽自治及其算
基于OpenFlow技术的流量分发管理系
基于DFI流量分类技术研究与实现
互联网流量综合处理平台的研究与实
开放式可重构监控系统设计与实现
接入传输网络设备中ITU-T Y.1564测
分布式系统业务通道检测的研究与实
基于实测流量的丢包率研究
异构网络测试床拓扑映射算法研究
网络流量特征分析与特征选择
基于网络质量评价的视频源选择系统
基于混合方法的网络流量分类技术研
用于入侵取证的大规模取证日志自动
网络安全与国家主权:互联网自由的
网络安全关键策略及教学模拟攻防系
基于数据不可信的缓冲区溢出攻击检
基于信任及风险的访问控制模型研究
自治化信任管理系统研究
信息中心网络路由算法的设计与仿真
Web输入验证脆弱性检测方法研究与改
基于浏览器扩展的Drive-by downloa
虚拟机防火墙系统的设计与实现
新闻聚类论文
网络爬虫论文
网页去重论文
正文提取论文
分布式系统论文
K-Means算法论文
版权申明
:目录由用户
胡**
提供,
www.51papers.com
仅收录目录,作者需要删除这篇论文目录
请点击这里
。
|
设为首页
||
加入收藏
||
站内搜索引擎
||
站点地图
||
在线购卡
|
版权所有
教育论文网
Copyright(C) All Rights Reserved