载入中...
一种改进Best-First算法的主题爬虫搜索算法研究
硕士博士毕业论文站内搜索
全站论文库
硕士博士论文库
普通期刊论文库
分类:
教育论文网
→工业技术论文→
自动化技术、计算机技术论文
→
计算技术、计算机技术论文
→
计算机的应用论文
→
信息处理(信息加工)论文
→
检索机论文
一种改进Best-First算法的主题爬虫搜索算法研究
论文目录
中文摘要
第1-4页
英文摘要
第4-8页
1 绪论
第8-16页
1.1 选题背景及研究意义
第8-10页
1.2 研究现状及难点问题
第10-14页
1.2.1 国内外研究现状
第10-13页
1.2.2 研究的难点问题
第13-14页
1.3 主要研究内容
第14-15页
1.4 论文的组织和安排
第15-16页
2 相关理论与技术
第16-26页
2.1 网络爬虫基本原理
第16-19页
2.1.1 网络爬虫框架
第16-17页
2.1.2 爬虫搜索策略
第17-19页
2.2 主题爬虫工作流程
第19-20页
2.3 主题描述
第20-21页
2.3.1 关键词法
第20页
2.3.2 Ontology法
第20-21页
2.3.3 层次目录树法
第21页
2.4 网页预处理
第21-25页
2.4.1 HTML标签
第21-22页
2.4.2 网页标题和正文内容的提取
第22-23页
2.4.3 锚文本的提取
第23-25页
2.4.4 中文分词
第25页
2.5 本章小结
第25-26页
3 基于页面内容评价的Best-First算法
第26-38页
3.1 概述
第26页
3.2 Best-First算法
第26-32页
3.2.1 基本思想
第26页
3.2.2 向量空间模型
第26-29页
3.2.3 权重计算方法
第29-32页
3.3 改进Best-First算法
第32-37页
3.4 本章小结
第37-38页
4 实验及结果分析
第38-44页
4.1 评价标准
第38-39页
4.2 实验分析
第39-43页
4.2.1 实验环境简介
第39页
4.2.2 实验参数分析
第39-40页
4.2.3 实验结果分析
第40-43页
4.3 本章小结
第43-44页
5 总结和展望
第44-46页
5.1 总结
第44页
5.2 展望
第44-46页
致谢
第46-47页
参考文献
第47-50页
附录
第50页
本篇论文共
50
页,
点击这进入下载页面
。
更多论文
一种改进Best-First算法的主题爬虫
柑橘皮综合开发关键技术研究
融合多特征聚类的垃圾微博检测研究
几种食品添加剂与蛋白质、DNA相互作
推荐系统中协同过滤算法研究
基于特征关联的跨领域情感分类方法
单月桂酸甘油酯的抑菌性能及机理研
频繁依存子树模式在问题分类中的应
白腐菌发酵产漆酶工艺的研究及其在
基于字频分布的中文网页编码识别研
巴西饮料包装设计
基于词共现的关键词抽取算法研究
柑橘果胶的凝胶特性研究和荸荠皮果
基于本体的大型复杂设备文本维修案
基于免疫磁珠的痕量黄曲霉毒素B
基于Ren-CECps及MSTN的会话情感应答
抗伏马菌素B1单链抗体的制备及其免
基于多维频繁子树模式的中文问句中
油脂微胶囊壁材主要成分相互作用研
基于网络分析的推荐方法研究
免疫磁珠分离结合荧光微球免疫层析
面向个性化需求的云物流资源语义匹
N-中碳链脂肪酰基氨基酸盐的合成及
基于混合推荐的手机阅读推荐系统的
废铝屑熔炼工艺及组织性能的研究
基于MVC+Lucene.Net.net框架下的垂
新钢RH炉控制系统的开发设计与分析
基于模板的应答系统的研究与设计
高炉自动上料系统
基于朴素贝叶斯短信分类系统的设计
塑料模具设计网络教学平台的设计与
基于本体的多媒体素材网络爬虫设计
结合信任模型的协同过滤推荐系统研
基于异构网络分析的商品推荐系统研
铸件浇口切割机的机械设计与研究
基于情境感知的移动终端用户消费行
局部干法水下焊接工艺及焊缝质量研
基于本体的教育资源组织及语义检索
低碳钢堆焊表面改性工艺及其热过程
无铅焊锡丝用低含量改性松香型无卤
基于社交用户信任度和标注动机的标
微渣自保护药芯焊丝及其堆焊合金性
基于DFA与特征量化的代码相似度可视
无铅焊料Sn-Cu系用无卤素无松香免清
基于概率主题模型的微博新闻个性化
基于旋转电弧TIG焊的薄板焊缝跟踪系
基于领域本体的个性化旅游推荐系统
Best-First算法论文
主题相关性论文
HTML标签论文
准确率论文
召回率论文
版权申明
:目录由用户
chjido**
提供,
www.51papers.com
仅收录目录,作者需要删除这篇论文目录
请点击这里
。
|
设为首页
||
加入收藏
||
站内搜索引擎
||
站点地图
||
在线购卡
|
版权所有
教育论文网
Copyright(C) All Rights Reserved