论文目录 | |
绪 论 | 第1-18
页 |
· 原核生物及真核生物基因组 | 第8-10
页 |
· 生物信息学及其主要研究内容 | 第10-12
页 |
· 原核及真核生物基因识别算法 | 第12-15
页 |
· 本论文的主要工作 | 第15-18
页 |
第二章 DNA序列的Z曲线理论 | 第18-25
页 |
· DNA序列的Z曲线理论 | 第18-19
页 |
· 考虑密码子内部相邻碱基近程相关性的Z曲线理论 | 第19-21
页 |
· 描述基因组GC含量沿序列分布的 曲线 | 第21-22
页 |
· Z曲线理论的应用 | 第22-25
页 |
第三章 细菌和古细菌基因组中可疑ORFS的基因识别算法 | 第25-41
页 |
· 引言 | 第25-26
页 |
· 材料与方法 | 第26-29
页 |
· 材料 | 第26-28
页 |
· 方法 | 第28-29
页 |
· 结果 | 第29-34
页 |
· 十重交叉检验 (Ten-fold cross-validation tests) | 第29-31
页 |
· 最终Fisher系数及第十一重交叉检验 | 第31-34
页 |
· 讨论 | 第34-40
页 |
· 用Z曲线方法得到高识别精度的原因 | 第34-38
页 |
· 57个细菌、古细菌基因组中Fisher系数和GC含量的关系 | 第38-40
页 |
· 网上服务及补充材料 | 第40-41
页 |
第四章 七个亲缘关系很远的高GC含量微生物基因组采用相似的密码子使用模式 | 第41-52
页 |
· 引言 | 第41-42
页 |
· 材料与方法 | 第42-44
页 |
· 结果与讨论 | 第44-52
页 |
· 算法的识别精度及Fisher系数在第一组中的通用性 | 第44-47
页 |
· 十个基因组中碱基在三个密码子位的分布模式 | 第47-50
页 |
· 第一组中三个参数的重要性排序以及C. crescentus与lobacterium. sp. NRC的GC2-GC3 图 | 第50-52
页 |
第五章 冠状病毒基因识别及多聚蛋白酶切位点预测软件ZCURVE_COV及其在SARS冠状病毒基因组分析中的应用 | 第52-75
页 |
· 引言 | 第53-56
页 |
· 材料与方法 | 第56-64
页 |
· 数据库 | 第56-57
页 |
· 基因识别算法 | 第57-64
页 |
· 结果与讨论 | 第64-74
页 |
· 比较ZCURVE_CoV和GeneMark.hmm | 第64-65
页 |
· 应用ZCURVE_CoV分析SARS-CoV基因组 | 第65-68
页 |
· 多序列比对6个可能的非结构蛋白编码基因 | 第68-69
页 |
· 冠状病毒基因组多聚蛋白酶切位点预测结果 | 第69-73
页 |
· 网上服务及补充材料 | 第73-74
页 |
· 结论 | 第74-75
页 |
第六章 拟南芥基因组的ISOCHORE结构分析 | 第75-86
页 |
· 引言 | 第76-77
页 |
· 材料与方法 | 第77
页 |
· 材料 | 第77
页 |
· Z’曲线方法 | 第77
页 |
· 结果与讨论 | 第77-83
页 |
· 拟南芥五条染色体的Z’曲线及isochore的特征 | 第77-81
页 |
· isochore的一些生物学特征 | 第81-83
页 |
· 结论 | 第83-86
页 |
第七章 基于Z曲线方法的真核生物基因识别软件ZCURVE_E | 第86-103
页 |
· 引言 | 第86-88
页 |
· 材料与方法 | 第88-97
页 |
· 训练和检验集 | 第88-89
页 |
· 算法描述 | 第89-97
页 |
· 结果与讨论 | 第97-101
页 |
· 基于四个物种检验集的基因识别预测结果 | 第97-100
页 |
· 联合使用Zcurve_E 和 Genscan | 第100-101
页 |
· 网站介绍 | 第101-102
页 |
结论 | 第102-103
页 |
总结论 | 第103-105
页 |
参考文献 | 第105-116
页 |
发表论文及参加科研情况说明 | 第116-117
页 |
附录I 主要的原核及真核生物从头预测基因识别软件及网址 | 第117-118
页 |
附录II 多聚蛋白酶切位点分析所用的冠状病毒基因组 | 第118-119
页 |
附录III 水稻检验库165条序列的GENBANK号 | 第119-120
页 |
致 谢 | 第120
页 |