教育论文网

基于英汉双语平行语料库的句法级知识挖掘和抽取研究

硕士博士毕业论文站内搜索    
分类:教育论文网→科学文化教育体育论文→信息与知识传播论文图书馆学、图书馆事业论文文献标引与编目论文
基于英汉双语平行语料库的句法级知识挖掘和抽取研究
论文目录
 
摘要第1-7页
Abstract第7-15页
第1章 引言第15-21页
  1.1 课题提出第15页
  1.2 研究意义第15-17页
    1.2.1 情报学方面第15-16页
    1.2.2 自然语言处理方面第16-17页
  1.3 研究方法第17-18页
  1.4 研究技术路线第18页
  1.5 本文研究的创新点第18-19页
  1.6 文章结构和所用资源第19-21页
    1.6.1 文章结构第19-20页
    1.6.2 研究所用资源第20-21页
第2章 相关研究综述第21-38页
  2.1 面向网络获取相关英汉双语平行语料的概述第21-22页
  2.2 词汇句法功能分布的相关研究概况第22-28页
    2.2.1 词汇句法功能的概念第22页
    2.2.2 词汇句法功能相关研究概述第22-25页
    2.2.3 洛特卡定律的研究概况第25-28页
  2.3 短语结构知识抽取的相关研究综述第28-33页
    2.3.1 短语结构抽取研究总体概况第28-30页
    2.3.2 介宾短语结构知识抽取研究现状第30-33页
  2.4 类别知识挖掘的相关研究第33-36页
    2.4.1 双语或多语词汇序列在文本聚类中的相关研究第33-34页
    2.4.2 英汉双语聚类中的停用词和词干或词形还原相关研究第34-35页
    2.4.3 双语或多语词汇和词性序列知识在文本聚类中的相关研究第35-36页
  2.5 小结第36-38页
第3章 面向网络的英汉双语平行语料库自动构建第38-47页
  3.1 确定获取语料网站和制定抓取词汇底表第38-41页
    3.1.1 确定获取语料网站第38-40页
    3.1.2 制定抓取网页的底表第40-41页
  3.2 网页的抓取和英汉双语平行语料的抽取第41-46页
    3.2.1 含有英汉双语平行语料网页的抓取第41-43页
    3.2.2 英汉双语平行语料对的抽取和后续整理和加工第43-46页
  3.3 小结第46-47页
第4章 基于英汉双语平行语料库的词汇句法功能分布复杂度呈现规律的知识挖掘第47-88页
  4.1 词汇句法功能分布复杂度统计数据源简介和句法结构调整第47-62页
    4.1.1 统计数据来源简介第47-51页
    4.1.2 相应句法结构调整第51-62页
  4.2 词汇句法功能分布复杂度的获取第62-74页
    4.2.1 基于调整结果完成对树库的结构转换第62-64页
    4.2.2 词汇句法功能分布复杂度的获取第64-74页
  4.3 词汇句法功能分布复杂度的洛特卡现象揭示第74-86页
    4.3.1 英汉词汇句法功能分布复杂度分析第74-81页
    4.3.2 英汉词汇句法功能分布复杂度的洛特卡现象第81-86页
  4.4 小结第86-88页
第5章 基于英汉双语平行语料库的短语结构知识抽取——以介宾短语结构为例第88-116页
  5.1 英汉双语介宾短语结构句法特征统计分析第88-103页
    5.1.1 句法功能与外部连接第88-93页
    5.1.2 介宾短语结构内部句法特征分析第93-103页
  5.2 有关介宾短语结构知识抽取模型构建的相关介绍和预处理第103-112页
    5.2.1 相关统计机器学习模型简介和确定第104-106页
    5.2.2 机器学习工具选择和语料预处理第106-109页
    5.2.3 机器学习特征模板的确定第109-111页
    5.2.4 知识抽取模型构建的整个流程和评价方法第111-112页
  5.3 介宾短语结构知识抽取模型的确定和英汉双语介宾短语结构知识的抽取第112-115页
    5.3.1 基于自身特征模板的知识抽取模型训练和性能对比第112-114页
    5.3.2 基于添加特征模板的汉英介宾短语结构知识抽取模型构建第114-115页
    5.3.3 面向英汉双语平行语料库的英汉介宾短语结构知识抽取第115页
  5.4 小结第115-116页
第6章 基于英汉双语平行语料库的复杂短语级类别知识挖掘第116-133页
  6.1 面向英汉双语专门复杂短语平行语料的聚类和词干或词形算法确定第116-119页
    6.1.1 基于实验的类别知识挖掘聚类算法确定第116-118页
    6.1.2 基于实验的英语词干或词形还原算法确定第118-119页
  6.2 语料的预处理和相关统计第119-123页
    6.2.1 语料简介第119-121页
    6.2.2 英汉双语复杂短语平行语料的字符处理第121-122页
    6.2.3 中英文预处理第122-123页
  6.3 面向英汉双语复杂短语平行语料的词性选择第123-126页
  6.4 基于英汉双语复杂短语平行语料的类别知识挖掘第126-132页
    6.4.1 英汉双语词汇特征在类别知识挖掘中的性能第126-129页
    6.4.2 基于英汉词性的英汉双语复杂短语平行语料类别知识挖掘第129-132页
  6.5 小结第132-133页
第7章 结语第133-135页
  7.1 研究工作总结第133-134页
  7.2 下一步的研究计划第134-135页
参考文献第135-143页
附录1 相关词性标注集和训练模板第143-152页
附录2 攻读博士学位期间主要科研成果及奖励第152-156页
致谢第156-158页

本篇论文共158页,点击这进入下载页面
 
更多论文
基于英汉双语平行语料库的句法级知
百货商店品牌对顾客忠诚度影响研究
供应链金融的风险管理问题研究
基于SOA的数字图书馆系统架构研究
原产地效应及网络口碑对购买意向的
基于数据挖掘技术的复合图书馆流程
信任品市场厂商策略性竞争研究
《金陵光》(The University of Na
零售品牌的网络体验营销策略研究
媒体传播对个体风险感知的影响研究
民营上市公司现金持有量影响因素的
基于图拉普拉斯的多自主体系统分布
流动资产减值与盈余管理研究
基于欠驱动性的双足机器人高能效行
国家控股、资本成本与EVA考核
多约束下的机械臂运动控制算法研究
内部控制质量与会计信息质量的关系
基于WSN的分布式传感器系统关键技术
合并商誉对企业盈利能力影响的实证
水下无线传感器网络节点定位与目标
国家控股、自由现金流与企业可持续
多智能体系统的鲁棒同步控制
内部控制有效性研究
企业集团财务管控问题研究
多智能体复杂系统集群控制研究
我国企业环境成本的计量和披露研究
跨领域中文评论的意见挖掘研究
企业预算松弛行为成因实证研究
基于屏幕视觉热区的交互收敛式个性
内部控制制度在企业实践中有效实施
目标光学特性建模及其应用研究
我国上市公司财务困境预测模型的参
视觉场景理解与交互关键技术研究
自愿性信息披露对企业价值影响的研
颜色和形状特征捆绑视觉认知机制及
交叉上市公司股权结构与公司绩效相
场景规约的时间性质分析研究
民营制造业上市公司现金流量与企业
宽带卫星通信网络IP组网技术研究
汇兑损益确认方法的改进及汇率风险
LTE/LTE-A面向MTC的信令优化关键技
财务困境中的上市公司脱困路径研究
微波/毫米波系统前端关键技术研究
研发费用投入与企业价值相关性研究
水下无线传感器网络媒体接入控制协
国家控股与股权资本成本关系研究
移动计算平台的室内定位系统研究及
企业财务预警模型研究——来自信息
基于铁氧体加载基片集成波导的频率
企业建立内部控制过程中的问题和对
毫米波单片集成混频器的设计及其小
终极控制人特征对资本结构的影响—
基于多层柔性超材料的THz器件
银企互联在企业现金管理中的应用研
基于H_∞滤波理论和多模型算法的机
公司治理与现金持有关系的统计分析
片上网络的系统可工作性建模、仿真
金字塔结构下终极控制权、现金流权
企业集团财务内部控制问题研究
集成电路工艺偏差的片上检测与应用
防伪成本相关问题研究
增强型高压AlGaN/GaN HEMTs器件的场
我国集团企业全面预算管理研究——
高压SiC JFET器件的设计、制备与应
上市公司财务策略管理与盈利能力的
新型波导结构中的光传输
上市公司合并报表与股价的相关性研
目标强激光热效应及其逆问题应用研
网络财务信息披露对公司财务绩效作
我国农业电视新闻中的农民话语表达
会计稳健性、盈余持续性与市场反应
引入外资股东对我国民营上市公司股
媒介技术的哲学研究
中国公司市盈率:经验证据
基于字典学习算法的遥感图像复原及
中国上市公司R&D投入与内部现金流分
稀疏与低秩先验下的高光谱分类与检
中国上市公司资源配置与收益率分布
基于多传感器信息融合的超限超载检
税率变动下上市公司盈余管理行为与
具有信道受限和通信能量约束的网络
创现能力与公司价值关系研究——基
 
树库 洛特卡现象论文 介宾短语结构论文 条件随机场论文 聚类算法论文
版权申明:目录由用户yangxuew**提供,www.51papers.com仅收录目录,作者需要删除这篇论文目录请点击这里
| 设为首页||加入收藏||站内搜索引擎||站点地图||在线购卡|
版权所有 教育论文网 Copyright(C) All Rights Reserved