教育论文网

基于机器学习的多源异构大数据清洗技术研究

硕士博士毕业论文站内搜索    
分类1:教育论文网→工业技术论文→自动化技术、计算机技术论文计算技术、计算机技术论文计算机软件论文程序设计、软件工程论文程序设计论文
分类2:教育论文网→工业技术论文→自动化技术、计算机技术论文自动化基础理论论文人工智能理论论文自动推理、机器学习论文
基于机器学习的多源异构大数据清洗技术研究
论文目录
 
摘要第1-6页
ABSTRACT第6-10页
第一章 绪论第10-18页
  1.1 研究背景第10-11页
  1.2 相关研究进展第11-16页
    1.2.1 相似重复数据清洗第13-14页
    1.2.2 不精确数据清洗第14-15页
    1.2.3 机器学习的应用第15-16页
  1.3 本文工作内容第16-17页
  1.4 文章组织结构第17-18页
第二章 数据清洗技术概述第18-28页
  2.1 数据清洗第18-21页
    2.1.1 主要研究内容第18-20页
    2.1.2 面临的问题与挑战第20-21页
  2.2 机器学习技术第21-25页
    2.2.1 贝叶斯网络第22-23页
    2.2.2 粗糙集理论第23-25页
  2.3 ETL工具第25-27页
  2.4 本章小结第27-28页
第三章 基于贝叶斯网络的层次约减分类清洗方法第28-40页
  3.1 问题的提出第28-29页
  3.2 层次约减模型设计第29-35页
    3.2.1 数据源约减模型第29-31页
    3.2.2 标记属性与元组的权重第31-33页
    3.2.3 重要度度量算法设计第33-35页
  3.3 TAN网模型构建第35-39页
  3.4 本章小结第39-40页
第四章 基于粗糙集的属性约减联合清洗方法第40-51页
  4.1 问题的提出第40-42页
  4.2 建立数据属性标准库第42-43页
  4.3 基于粗糙集的属性约减第43-47页
  4.4 联合清洗算法设计第47-50页
  4.5 本章小结第50-51页
第五章 实验第51-67页
  5.1 实验环境与数据第51-56页
    5.1.1 实验环境第51-52页
    5.1.2 数据准备第52-53页
    5.1.3 模型训练第53-54页
    5.1.4 性能测试第54-56页
  5.2 实验与分析第56-65页
    5.2.1 不精确数据清洗实验设计第57-62页
    5.2.2 相似重复数据清洗对比实验第62-65页
  5.3 本章小结第65-67页
第六章 结束语第67-69页
  6.1 工作总结第67-68页
  6.2 工作展望第68-69页
参考文献第69-74页
致谢第74-75页
攻读硕士学位期间参加科研情况第75页

本篇论文共75页,点击这进入下载页面
 
更多论文
基于机器学习的多源异构大数据清洗
金属电介质纳米复合薄膜的表面等离
基于区块链的食品安全追溯技术研究
基于分子动力学的纳米薄膜力学行为
邻域相似度自适应近邻传播聚类算法
改性富锆PZT梯度薄膜的储能性能研究
统一SQL大数据查询系统的设计与实现
电光激励对掺稀土镧代锆钛酸铅陶瓷
基于SQL和NoSQL的混合存储系统的设
表面修饰对Er3+-Yb
基于数据挖掘方法的客户细分及流失
共轭聚合物链中电荷载流子迁移率的
数据挖掘技术在电信行业中的应用研
基于分布式聚类分析的上网时长估算
相位差法扩展目标波前探测技术的研
金属薄膜超透镜光刻成像质量的研究
基于标绘数据的旅游信息挖掘研究
基于波前编码技术的大景深显微物镜
利用过程挖掘提高网络游戏客户分类
基于表面等离子体的光学聚焦器件研
教育领域的关联挖掘和学习预测技术
非自治涡旋光孤子的传播特性研究
军用电子元器件基础工艺数据库系统
超短脉冲在PPLT中的传播特性研究
基于DAG的数据流处理与分析引擎的研
强激光长程传输过程中受激转动拉曼
面向特定目标识别系统及其数据库的
典型激光染料双光子吸收特性研究
基于Hive的商品销售多维分析平台设
百皮秒激光脉冲高效放大方法研究
基于海量数据的客户价值模型设计与
表面等离子体飞秒脉冲的传输
基于遗传算法的并行化K-means聚类算
几种半导体材料载流子超快弛豫过程
基于Hadoop的零售银行客户精准分类
受激布里渊散射相干并束独立池方案
基于数据挖掘的运动处方生成研究
基于表面等离激元的泵浦探测及四波
基于大数据的某银行CRM系统的设计与
宽光谱大视场角多层衍射光学元件的
突发事件案例情景间关联规则挖掘及
论北大《歌谣周刊》的非物质文化遗
基于子空间学习的低秩表示
企业级数据库服务器性能测试工具设
三维外势下玻色—爱因斯坦凝聚基态
基于大数据的广告投放平台
(2+1)维变系数三五次Gross-Pitae
数据挖掘在银行对公客户信用风险管
探讨去除心动过速的新方法
面向大数据的DBSCAN聚类算法研究
协同论视域下摩尔定律工程基础演化
 
机器学习论文 数据清洗论文 相似重复数据论文 属性约减论文 贝叶斯网络论文 粗糙集论文
版权申明:目录由用户xfl6**提供,www.51papers.com仅收录目录,作者需要删除这篇论文目录请点击这里
| 设为首页||加入收藏||站内搜索引擎||站点地图||在线购卡|
版权所有 教育论文网 Copyright(C) All Rights Reserved