教育论文网

分布式垂直搜索引擎的研究与设计

硕士博士毕业论文站内搜索    
分类:教育论文网→工业技术论文→自动化技术、计算机技术论文计算技术、计算机技术论文计算机的应用论文信息处理(信息加工)论文检索机论文
分布式垂直搜索引擎的研究与设计
论文目录
 
摘要第1-6页
ABSTRACT第6-13页
第一章 绪论第13-16页
  1.1 研究背景及意义第13页
  1.2 项目需求分析第13-14页
  1.3 本文主要工作第14-15页
  1.4 本文组织结构第15-16页
第二章 相关技术概述第16-25页
  2.1 Lucene简介第16-17页
    2.1.1 Lucene概述第16页
    2.1.2 Lucene架构第16-17页
  2.2 Solr简介第17-18页
    2.2.1 Solr概述第17-18页
    2.2.2 Solr整体架构第18页
  2.3 Nosql数据库HBase第18-20页
  2.4 内存数据库redis第20页
  2.5 中文分词介绍第20-24页
    2.5.1 中文分词的原理和工作流程第20-22页
    2.5.2 中文分词常用模型第22-24页
  2.6 小结第24-25页
第三章 系统设计第25-39页
  3.1 系统功能说明第25-26页
  3.2 网页采集解析模块设计第26-27页
  3.3 数据存储模块设计第27-28页
    3.3.1 Hbase的表的设计第28页
    3.3.2 Redis存储URL链接第28页
  3.4 URL调度器与集群监控模块的设计第28-30页
    3.4.1 URL调度器设计第28-29页
    3.4.2 监控模块设计第29-30页
  3.5 索引检索模块设计第30-33页
    3.5.1 系统架构第30-31页
    3.5.2 方案选型第31-32页
    3.5.3 与其他子系统的关系第32-33页
  3.6 隐马尔科夫模型及其在中文分词中的应用第33-37页
    3.6.1 隐马尔科夫中文分词模型及其原理第33-37页
    3.6.2 中文分词的主要问题第37页
  3.7 前端展现模块的设计第37-38页
  3.8 小结第38-39页
第四章 项目实现及测试第39-83页
  4.1 采集解析模块的实现与测试第39-49页
    4.1.1 数据采集第39-40页
    4.1.2 商品详细页面解析的实现及测试第40-46页
    4.1.3 商品列表页面解析的实现及测试第46-48页
    4.1.4 小结第48-49页
  4.2 数据存储及多线程的实现及测试第49-55页
    4.2.1 存储商品明细信息第49-52页
    4.2.2 redis作为URL仓库存储URL链接第52-55页
    4.2.3 多线程爬取第55页
  4.3 URL调度器与集群监控模块的实现与测试第55-62页
    4.3.1 URL调度器的实现及测试第55-59页
    4.3.2 集群监控模块的实现及测试第59-62页
  4.4 索引检索模块实现及测试第62-66页
  4.5 中文分词改进及测试第66-72页
    4.5.1 基于HMM模型的中文分词实现第66-69页
    4.5.2 分词算法的改进第69-71页
    4.5.3 结果测试第71-72页
  4.6 前端展现模块实现及测试第72-73页
  4.7 项目部署及测试第73-83页
    4.7.1 测试环境第73-75页
    4.7.2 功能测试第75-79页
    4.7.3 性能测试第79-82页
    4.7.4 SolrCloud高可用测试第82-83页
第五章 总结与展望第83-84页
  5.1 工作总结第83页
  5.2 展望第83-84页
致谢第84-85页
参考文献第85-86页

本篇论文共86页,点击这进入下载页面
 
更多论文
分布式垂直搜索引擎的研究与设计
基于Hadoop的分布式网络爬虫系统的
融合信任关系的二重聚类推荐算法研
基于GA-KNN分类模型在船期数据分析
基于主题模型的社交网络关系发现算
基于用户行为的内容加速系统的设计
网络爬虫技术在云平台上的研究与实
在线社会媒体的流行性预测研究
网络舆情引导平台系统及其关键技术
基于用户画像的医疗信息精准推荐的
主题引导推荐系统
中文开放式实体关系抽取研究与实现
汉语虚词用法在短语句法分析中的应
基于本体的语义相似度研究
面向中医医案的数据挖掘技术研究及
结合正向和负向相关因子的推荐算法
MOOC讨论区数据挖掘与应用
Web事件关联关系挖掘研究
智能电视端下基于主题模型的视频推
基于高效流形排序算法的课程相似度
基于内容和链接的主题爬虫的研究与
推荐系统框架模型及协同过滤算法研
上下文感知系统框架及不一致上下文
基于Spark的sMRI影像分类诊断与电影
kmeans聚类算法的改进及其在信息检
一种基于改进协同过滤的电子商务推
基于新浪微博的短文本分类研究
基于组合策略的IPTV节目推荐
基于混合方式的电影个性化推荐研究
基于党建领域社交网络的协同主题回
协同过滤推荐系统中冷启动问题的研
词典与统计相结合的傣文分词方法与
基于LDA主题模型和标签聚类的党建信
基于维基百科的中文命名实体语料库
基于双语的事件抽取方法研究
句子级情绪分类方法研究
面向微博文本的情绪分析方法研究
统计机器翻译领域自适应方法研究
基于MLN的中文事件推理方法的研究
基于平行语料库的跨语言实体关系抽
基于用户偏好分析的个性化信息检索
文华学院学生就业推荐与招聘系统研
基于混合模式的个性化音乐推荐系统
基于空间数据挖掘的个性化旅游景点
基于行为分析的个性化旅游景区推荐
个性化混合推荐算法在旅游中的应用
基于遗传算法的跨领域产品评论的虚
基于图数据库的产品评论情感分析与
微博新词发现与新词情感倾向性研究
电影评分数据分析及用户行为偏好建
聚类算法和卷积神经网络在文本情感
基于地理坐标的微博事件检测与分析
基于交叉词项的中文信息检索方法研
优化特征选择的CTM模型在文本分类中
基于神经网络集成和用户偏好模型的
基于偏好感知的微信公众平台混合推
基于云模型理论的LDA最大熵模型观点
基于改进TFIDF的混合模型文本分类方
基于超图的文本摘要与关键词协同抽
基于语义指纹和云模型的动态词义变
基于语义指纹关联的网络事件热度分
基于语义分析的文本检索模型技术研
中文短文本实体识别和链接研究
改进的互信息与LDA结合的特征降维方
汉语复句中基于语料统计的决策式依
基于关系词搭配的汉语复句依存关系
中文微博评论对象抽取研究
基于社交网络文本分析的短期股市行
基于微信公众号的文本分类研究
 
海量数据论文 爬虫 索引 Hadoop论文 Hbase论文
版权申明:目录由用户王**提供,www.51papers.com仅收录目录,作者需要删除这篇论文目录请点击这里
| 设为首页||加入收藏||站内搜索引擎||站点地图||在线购卡|
版权所有 教育论文网 Copyright(C) All Rights Reserved