教育论文网

面向网上订餐的垂直搜索引擎的设计与实现

硕士博士毕业论文站内搜索    
分类:教育论文网→工业技术论文→自动化技术、计算机技术论文计算技术、计算机技术论文计算机的应用论文信息处理(信息加工)论文检索机论文
面向网上订餐的垂直搜索引擎的设计与实现
论文目录
 
摘要第1-6页
ABSTRACT第6-11页
第一章 绪论第11-15页
  1.1 研究背景和意义第11页
  1.2 国内外的研究现状第11-13页
  1.3 本文的研究内容和结构安排第13-15页
    1.3.1 本文的研究内容第13-14页
    1.3.2 本文的结构安排第14-15页
第二章 垂直搜索引擎的相关理论知识第15-30页
  2.1 垂直搜索引擎的概述第15-16页
  2.2 垂直搜索引擎的原理及结构第16-17页
  2.3 聚焦网络爬虫技术第17-24页
    2.3.1 聚焦网络爬虫概述第17-18页
    2.3.2 Heritrix的系统架构第18-19页
    2.3.3 Heritrix的功能组件第19-21页
    2.3.4 Heritrix的扩展定制第21-23页
    2.3.5 网页去重技术第23-24页
  2.4 信息索引技术第24-29页
    2.4.1 HTML简介第24页
    2.4.2 网页内容提取第24-27页
    2.4.3 索引创建第27-29页
  2.5 本章小结第29-30页
第三章 基于多策略融合的聚焦网络爬虫模型第30-44页
  3.1 基于URL链接结构的网络爬虫策略第30-33页
    3.1.1 策略简介第30-32页
    3.1.2 优缺点分析第32-33页
  3.2 基于页面内容的网络爬虫策略第33-38页
    3.2.1 相关度判定第33-36页
    3.2.2 策略简介第36-37页
    3.2.3 优缺点分析第37-38页
  3.3 改进的聚焦网络爬虫策略第38-40页
  3.4 实验验证第40-43页
    3.4.1 实验环境及数据集第40页
    3.4.2 评价指标及实验设计第40-41页
    3.4.3 查准率对比分析第41-43页
  3.5 本章小结第43-44页
第四章 基于LUCENE搜索结果评分机制的改进第44-54页
  4.1 检索模型第44-47页
    4.1.1 布尔模型第44-45页
    4.1.2 向量空间模型第45-46页
    4.1.3 概率模型第46-47页
  4.2 Lucene自带的搜索结果评分机制第47-48页
    4.2.1 评分机制简介第47-48页
    4.2.2 优缺点分析第48页
  4.3 改进的Lucene评分机制第48-50页
    4.3.1 影响评分机制改进的因素第48-49页
    4.3.2 综合影响因素的改进第49-50页
  4.4 实验验证第50-53页
    4.4.1 实验环境及数据集第50页
    4.4.2 评价指标及实验设计第50-51页
    4.4.3 评分结果对比分析第51-53页
  4.5 本章小结第53-54页
第五章 面向网上订餐的垂直搜索引擎的设计与实现第54-69页
  5.1 系统的开发环境第54页
  5.2 系统的设计目标第54-55页
  5.3 系统的结构设计第55-56页
  5.4 系统功能模块的设计与实现第56-68页
    5.4.1 多策略融合的网络爬虫模块第56-58页
    5.4.2 网页内容提取模块第58-60页
    5.4.3 中文分词模块第60-62页
    5.4.4 索引建立模块第62-64页
    5.4.5 搜索结果排序模块第64-66页
    5.4.6 用户搜索及显示模块第66-68页
  5.5 本章小结第68-69页
第六章 系统测试第69-77页
  6.1 网页爬取测试第69-71页
  6.2 页面内容提取测试第71-72页
  6.3 索引测试第72-73页
  6.4 搜索引擎对比测试第73-76页
  6.5 本章小结第76-77页
第七章 结论第77-79页
  7.1 本文的主要贡献第77-78页
  7.2 下一步工作的展望第78-79页
致谢第79-80页
参考文献第80-84页

本篇论文共84页,点击这进入下载页面
 
更多论文
面向网上订餐的垂直搜索引擎的设计
基于流行性预测的推荐算法研究
贝叶斯算法在校园留言板垃圾过滤中
基于深度学习的文本特征表示及分类
基于语义表示与图正则的实体链接研
基于双重正则化的矩阵分解推荐算法
基于局部全局相似度的奇异值分解的
基于LDA的文本分类研究及其应用
基于并行IB的多语种文本聚类研究
面向微博文本的分词及情感分析研究
基于个性化推荐的酒店预订与入住系
基于移动用户行为的智能应用推荐算
异构语义日志知识库上频繁访问模式
协同过滤推荐系统中稀疏性数据的算
聊天系统文本情感细粒度分类研究与
基于协同过滤的健康知识推荐系统的
基于hadoop大数据框架的个性化推荐
基于实例的中文分词系统设计与实现
基于反向推荐的个性化推荐算法研究
最大和网络搜索结果多样性问题及其
基于词向量的在线评论话题及其特征
基于电商数据和用户行为的信息抽取
基于最大熵的机器翻译研究与实现
面向商业舆情分析的大规模数据处理
分布式垂直搜索引擎的研究与设计
基于Hadoop的分布式网络爬虫系统的
融合信任关系的二重聚类推荐算法研
基于GA-KNN分类模型在船期数据分析
基于主题模型的社交网络关系发现算
基于用户行为的内容加速系统的设计
网络爬虫技术在云平台上的研究与实
在线社会媒体的流行性预测研究
网络舆情引导平台系统及其关键技术
基于用户画像的医疗信息精准推荐的
主题引导推荐系统
中文开放式实体关系抽取研究与实现
汉语虚词用法在短语句法分析中的应
基于本体的语义相似度研究
面向中医医案的数据挖掘技术研究及
结合正向和负向相关因子的推荐算法
MOOC讨论区数据挖掘与应用
Web事件关联关系挖掘研究
智能电视端下基于主题模型的视频推
基于高效流形排序算法的课程相似度
基于内容和链接的主题爬虫的研究与
推荐系统框架模型及协同过滤算法研
上下文感知系统框架及不一致上下文
基于Spark的sMRI影像分类诊断与电影
kmeans聚类算法的改进及其在信息检
一种基于改进协同过滤的电子商务推
基于新浪微博的短文本分类研究
基于组合策略的IPTV节目推荐
基于混合方式的电影个性化推荐研究
基于党建领域社交网络的协同主题回
协同过滤推荐系统中冷启动问题的研
词典与统计相结合的傣文分词方法与
基于LDA主题模型和标签聚类的党建信
基于维基百科的中文命名实体语料库
基于双语的事件抽取方法研究
句子级情绪分类方法研究
面向微博文本的情绪分析方法研究
统计机器翻译领域自适应方法研究
基于MLN的中文事件推理方法的研究
基于平行语料库的跨语言实体关系抽
基于用户偏好分析的个性化信息检索
文华学院学生就业推荐与招聘系统研
基于混合模式的个性化音乐推荐系统
基于空间数据挖掘的个性化旅游景点
基于行为分析的个性化旅游景区推荐
个性化混合推荐算法在旅游中的应用
基于遗传算法的跨领域产品评论的虚
基于图数据库的产品评论情感分析与
微博新词发现与新词情感倾向性研究
电影评分数据分析及用户行为偏好建
聚类算法和卷积神经网络在文本情感
基于地理坐标的微博事件检测与分析
基于交叉词项的中文信息检索方法研
 
网上订餐论文 多策略论文 评分机制论文 垂直搜索引擎论文
版权申明:目录由用户westfabl**提供,www.51papers.com仅收录目录,作者需要删除这篇论文目录请点击这里
| 设为首页||加入收藏||站内搜索引擎||站点地图||在线购卡|
版权所有 教育论文网 Copyright(C) All Rights Reserved