载入中...
分布式垂直搜索引擎的研究与设计
硕士博士毕业论文站内搜索
全站论文库
硕士博士论文库
普通期刊论文库
分类:
教育论文网
→工业技术论文→
自动化技术、计算机技术论文
→
计算技术、计算机技术论文
→
计算机的应用论文
→
信息处理(信息加工)论文
→
检索机论文
分布式垂直搜索引擎的研究与设计
论文目录
摘要
第1-6页
ABSTRACT
第6-13页
第一章 绪论
第13-16页
1.1 研究背景及意义
第13页
1.2 项目需求分析
第13-14页
1.3 本文主要工作
第14-15页
1.4 本文组织结构
第15-16页
第二章 相关技术概述
第16-25页
2.1 Lucene简介
第16-17页
2.1.1 Lucene概述
第16页
2.1.2 Lucene架构
第16-17页
2.2 Solr简介
第17-18页
2.2.1 Solr概述
第17-18页
2.2.2 Solr整体架构
第18页
2.3 Nosql数据库HBase
第18-20页
2.4 内存数据库redis
第20页
2.5 中文分词介绍
第20-24页
2.5.1 中文分词的原理和工作流程
第20-22页
2.5.2 中文分词常用模型
第22-24页
2.6 小结
第24-25页
第三章 系统设计
第25-39页
3.1 系统功能说明
第25-26页
3.2 网页采集解析模块设计
第26-27页
3.3 数据存储模块设计
第27-28页
3.3.1 Hbase的表的设计
第28页
3.3.2 Redis存储URL链接
第28页
3.4 URL调度器与集群监控模块的设计
第28-30页
3.4.1 URL调度器设计
第28-29页
3.4.2 监控模块设计
第29-30页
3.5 索引检索模块设计
第30-33页
3.5.1 系统架构
第30-31页
3.5.2 方案选型
第31-32页
3.5.3 与其他子系统的关系
第32-33页
3.6 隐马尔科夫模型及其在中文分词中的应用
第33-37页
3.6.1 隐马尔科夫中文分词模型及其原理
第33-37页
3.6.2 中文分词的主要问题
第37页
3.7 前端展现模块的设计
第37-38页
3.8 小结
第38-39页
第四章 项目实现及测试
第39-83页
4.1 采集解析模块的实现与测试
第39-49页
4.1.1 数据采集
第39-40页
4.1.2 商品详细页面解析的实现及测试
第40-46页
4.1.3 商品列表页面解析的实现及测试
第46-48页
4.1.4 小结
第48-49页
4.2 数据存储及多线程的实现及测试
第49-55页
4.2.1 存储商品明细信息
第49-52页
4.2.2 redis作为URL仓库存储URL链接
第52-55页
4.2.3 多线程爬取
第55页
4.3 URL调度器与集群监控模块的实现与测试
第55-62页
4.3.1 URL调度器的实现及测试
第55-59页
4.3.2 集群监控模块的实现及测试
第59-62页
4.4 索引检索模块实现及测试
第62-66页
4.5 中文分词改进及测试
第66-72页
4.5.1 基于HMM模型的中文分词实现
第66-69页
4.5.2 分词算法的改进
第69-71页
4.5.3 结果测试
第71-72页
4.6 前端展现模块实现及测试
第72-73页
4.7 项目部署及测试
第73-83页
4.7.1 测试环境
第73-75页
4.7.2 功能测试
第75-79页
4.7.3 性能测试
第79-82页
4.7.4 SolrCloud高可用测试
第82-83页
第五章 总结与展望
第83-84页
5.1 工作总结
第83页
5.2 展望
第83-84页
致谢
第84-85页
参考文献
第85-86页
本篇论文共
86
页,
点击这进入下载页面
。
更多论文
分布式垂直搜索引擎的研究与设计
基于Hadoop的分布式网络爬虫系统的
融合信任关系的二重聚类推荐算法研
基于GA-KNN分类模型在船期数据分析
基于主题模型的社交网络关系发现算
基于用户行为的内容加速系统的设计
网络爬虫技术在云平台上的研究与实
在线社会媒体的流行性预测研究
网络舆情引导平台系统及其关键技术
基于用户画像的医疗信息精准推荐的
主题引导推荐系统
中文开放式实体关系抽取研究与实现
汉语虚词用法在短语句法分析中的应
基于本体的语义相似度研究
面向中医医案的数据挖掘技术研究及
结合正向和负向相关因子的推荐算法
MOOC讨论区数据挖掘与应用
Web事件关联关系挖掘研究
智能电视端下基于主题模型的视频推
基于高效流形排序算法的课程相似度
基于内容和链接的主题爬虫的研究与
推荐系统框架模型及协同过滤算法研
上下文感知系统框架及不一致上下文
基于Spark的sMRI影像分类诊断与电影
kmeans聚类算法的改进及其在信息检
一种基于改进协同过滤的电子商务推
基于新浪微博的短文本分类研究
基于组合策略的IPTV节目推荐
基于混合方式的电影个性化推荐研究
基于党建领域社交网络的协同主题回
协同过滤推荐系统中冷启动问题的研
词典与统计相结合的傣文分词方法与
基于LDA主题模型和标签聚类的党建信
基于维基百科的中文命名实体语料库
基于双语的事件抽取方法研究
句子级情绪分类方法研究
面向微博文本的情绪分析方法研究
统计机器翻译领域自适应方法研究
基于MLN的中文事件推理方法的研究
基于平行语料库的跨语言实体关系抽
基于用户偏好分析的个性化信息检索
文华学院学生就业推荐与招聘系统研
基于混合模式的个性化音乐推荐系统
基于空间数据挖掘的个性化旅游景点
基于行为分析的个性化旅游景区推荐
个性化混合推荐算法在旅游中的应用
基于遗传算法的跨领域产品评论的虚
基于图数据库的产品评论情感分析与
微博新词发现与新词情感倾向性研究
电影评分数据分析及用户行为偏好建
聚类算法和卷积神经网络在文本情感
基于地理坐标的微博事件检测与分析
基于交叉词项的中文信息检索方法研
优化特征选择的CTM模型在文本分类中
基于神经网络集成和用户偏好模型的
基于偏好感知的微信公众平台混合推
基于云模型理论的LDA最大熵模型观点
基于改进TFIDF的混合模型文本分类方
基于超图的文本摘要与关键词协同抽
基于语义指纹和云模型的动态词义变
基于语义指纹关联的网络事件热度分
基于语义分析的文本检索模型技术研
中文短文本实体识别和链接研究
改进的互信息与LDA结合的特征降维方
汉语复句中基于语料统计的决策式依
基于关系词搭配的汉语复句依存关系
中文微博评论对象抽取研究
基于社交网络文本分析的短期股市行
基于微信公众号的文本分类研究
海量数据论文
爬虫 索引
Hadoop论文
Hbase论文
版权申明
:目录由用户
王**
提供,
www.51papers.com
仅收录目录,作者需要删除这篇论文目录
请点击这里
。
|
设为首页
||
加入收藏
||
站内搜索引擎
||
站点地图
||
在线购卡
|
版权所有
教育论文网
Copyright(C) All Rights Reserved