教育论文网

基于多特征的网页信息抽取技术的研究与应用

硕士博士毕业论文站内搜索    
分类1:教育论文网→工业技术论文→自动化技术、计算机技术论文计算技术、计算机技术论文计算机的应用论文计算机网络论文一般性问题论文
分类2:教育论文网→工业技术论文→自动化技术、计算机技术论文计算技术、计算机技术论文计算机的应用论文信息处理(信息加工)论文文字信息处理论文
基于多特征的网页信息抽取技术的研究与应用
论文目录
 
摘要第1-7页
Abstract第7-12页
  1. 绪论第12-20页
  1.1 课题背景与意义第12-13页
  1.2 国内外研究现状第13-17页
    1.2.1 网页信息形式化组织研究现状第13-14页
    1.2.2 信息抽取技术研究现状第14-17页
  1.3 论文研究思路及创新点第17-18页
  1.4 论文组织结构第18-20页
  2. 网页信息抽取相关技术介绍第20-26页
  2.1 网页信息抽取概念第20页
  2.2 网页信息抽取关键技术第20-23页
    2.2.1 HTML第20-21页
    2.2.2 XML第21-22页
    2.2.3 DOM第22-23页
    2.2.4 正则表达式第23页
  2.3 网页信息抽取评价标准第23-24页
  2.4 本章小结第24-26页
  3. 网页信息形式化描述模型第26-36页
  3.1 网页信息形式化描述概念及原理第28-31页
    3.1.1 网页信息形式化描述概念第28-30页
    3.1.2 网页信息、形式化组织原理第30-31页
  3.2 网页信息粒度模型第31-34页
  3.3 网页形式化模型优点第34-35页
  3.4 本章小结第35-36页
  4. 基于结构与视觉相结合的信息抽取算法改进第36-52页
  4.1 网页结构分析技术第36-39页
    4.1.1 利用DOM树分析页面结构第36-37页
    4.1.2 利用HTML标签特性分析第37-38页
    4.1.3 利用网页视觉特征第38-39页
  4.2 网页DOM结构预处理第39-43页
    4.2.1 HTML格式标准化第39-40页
    4.2.2 网页噪声信息清除第40-42页
    4.2.3 DOM树节点标记信息处理第42-43页
  4.3 基于DOM结构的HTML标签分析第43-45页
    4.3.1 HTML结构性标签分析第43-44页
    4.3.2 HTML可视性标签分析第44-45页
  4.4 文本视觉特征提取与处理第45-48页
    4.4.1 基于CSS样式的视觉特征处理第46-47页
    4.4.2 基于文本特征的视觉特征处理第47-48页
  4.5 基于提取特征的块聚类第48-50页
  4.6 阈值的分析与确定第50-51页
    4.6.1 标签阂值第50页
    4.6.2 文本阈值第50-51页
  4.7 本章小结第51-52页
  5. 仿真及应用实验系统设计第52-64页
  5.1 传统网站移动化系统简介第52页
  5.2 实验环境第52-53页
  5.3 仿真实验系统架构设计第53-55页
    5.3.1 信息抽取模块第53-54页
    5.3.2 网页预处理模块第54页
    5.3.3 DOM结构处理模块第54页
    5.3.4 视觉信息处理模块第54-55页
    5.3.5 信息块处理模块第55页
    5.3.6 超链接处理模块第55页
  5.4 仿真实验结果及分析第55-60页
    5.4.1 网页抽取与组织实验第55-56页
    5.4.2 运行结果分析第56-60页
  5.5 应用系统实验结果及分析第60-62页
    5.5.1 应用及优势第60-61页
    5.5.2 运行效果演示第61-62页
  5.6 本章小结第62-64页
  6. 总结与展望第64-67页
  6.1 主要工作第64-65页
  6.2 主要创新点第65页
  6.3 存在问题及未来方向第65-67页
参考文献第67-71页
个人简历第71页
在校期间研究成果第71-72页
致谢第72页

本篇论文共72页,点击这进入下载页面
 
更多论文
基于多特征的网页信息抽取技术的研
通州区农村生活污水处理适用技术的
基于文本密度和页面结构的网页信息
天津市大沽排污河淤泥的综合处理处
基于CEF的页面分割算法的研究
天津纪庄子污水处理厂除臭工程结构
基于PHP技术的普法网站系统设计与实
玉米酒精废水处理工艺研究
基于shopex系统的陇西药材商城网站
电絮凝技术处理微污染海水研究
微博兴趣社区发现及其热议话题检测
企业邮件安全及深层防御方法研究
地下水石油类污染物(BTEX)的微生物
PTN技术在城域网中的应用
改性壳聚糖对地下水重金属吸附性能
中等职业学校中心机房和网络的设计
高校校园无线网络平台的规划与实施
几类非线性系统的稳定性分析与观测
几类时滞系统的指数稳定性
基于观测器的饱和时滞广义系统的鲁
T-S模糊时滞系统耗散性分析与控制
基于改进粒子群蚁群融合算法的智能
核矩阵近似的研究及其在支持向量机
基于开放知识网络的关系推断技术研
昂贵区间多目标优化数据挖掘求解策
基于DEA和神经网络的西部耕地利用效
枣庄市水环境功能区划与环境容量的
基于GA-BP神经网络的储能锂离子电池
机器学习在信用评级中的应用
基于深度学习的极限学习机算法研究
人工神经网络在生物信息学中的应用
一种改进的人工蜂群算法及其在k均值
基因表达谱数据的挖掘模型构建
基于神经网络的企业R&D能力评价研究
基于BDI的多Agent系统的开发和运行
证据理论中基本概率指派生成与合成
基于证据理论的多源信息融合技术研
基于远程通信的消防员生命状态实时
基于导电碳黑糊电极的电化学传感器
光纤光栅传感器在海床超孔压监测中
雨量传感器液压运动平台
基于ZigBee网络室内定位系统设计与
一种基于上下文的WSN传输路径预测选
多跳水下传感器网络时间同步算法研
基于MVP架构的模具协同设计管理系统
基于RSSI的无线传感器网络定位算法
基于精密球面磨床的球度在位测量方
无线传感器网络虚假数据检测过滤机
微细切削加工技术的基础研究
氧化铝陶瓷激光热应力切割数值仿真
基于Wi-Fi的无线传感器网络节点设计
基于Linux图形交互式线切割CAM软件
级联型光子晶体光纤传感器制备与传
三维激光切割自动编程系统的开发
一种基于无线传感网的温室大棚环境
无线传感器网络分簇路由算法研究与
硅压阻式压力传感器高精度温度补偿
高强铝合金板材温热成形实验与理论
石英晶体传感器在软材料霍普金森压
7A60模锻件全面性能研究及70Si2Mn热
谐振式光纤陀螺小型化技术研究
智能传感器网络中地面目标磁敏信号
基于位错密度的流动应力模型的研究
微通道扁管面内绕弯成形过程的数值
移动机器人同时定位与地图创建算法
新型串并混联送料机械手设计与分析
典型铸钢件的数值模拟分析与工艺改
基于TRIZ理论的下肢康复机器人功能
3-1-1-1布局6-PSS并联机器人性能工
小型仿人机器人步态规划算法研究与
仿生机器鱼运动机理及水动力性能研
AUV自动驾驶的设计与实现
 
信息抽取论文 DOM分析论文 视觉特征论文
版权申明:目录由用户pyd8**提供,www.51papers.com仅收录目录,作者需要删除这篇论文目录请点击这里
| 设为首页||加入收藏||站内搜索引擎||站点地图||在线购卡|
版权所有 教育论文网 Copyright(C) All Rights Reserved