摘要5-6
ABSTRACT6-8
第一章 绪论8-13
1.1 生物信息学概述8-10
1.1.1 生物信息学产生背景和概念8
1.1.2 生物信息学的探讨内容8-10
1.2 生物医学文本挖掘概述10-11
1.2.1 生物医学文本挖掘的产生背景10
1.2.2 生物医学文本聚类概述10-11
1.3 本论文探讨的主要内容11
1.4 论文内容和组织结构11-13
第二章 生物医学文本的聚类算法探讨13-21
2.1 文本聚类概述13-14
2.2 文本表示14
2.3 常用聚类算法14-16
2.4 半监督聚类算法概述16-18
2.5 聚类评估标准18-19
2.6 生物医学文本聚类的探讨近况19-20
2.6.1 生物医学文本的特有特点:MeSH及PRA19
2.6.2 根据文献内容信息聚类的探讨19-20
2.6.3 根据语义信息聚类探讨20
2.7 生物医学文本聚类探讨的不足20
2.8 本章小结20-21
第三章 基于MESH本体的语义相似度度量21-39
3.1 MESH来源及其结构介绍21-23
3.2 MESH运用23-24
3.3 基于MESH本体的语义相似度度量策略24-29
3.3.1 通用概念25
3.3.2 基于路径的策略25-26
3.3.3 基于信息量的策略26-27
3.3.4 一种新的融合策略27-28
3.3.5 基于MeSH本体的语义相似度度量28-29
3.4 实验及结果浅析29-37
3.4.1 实验数据集29-31
3.4.2 评估标准31-32
3.4.3 实验及结果浅析32-37
3.5 本章小结37-39
第四章 基于信息融合的MEDLINE聚类算法39-52
4.1 MEDLINE文献的三种信息39
4.2 信息融合39-41
4.3 相似度融合对策LINEAR COMBINATION(LCM)41
4.4 主辅融合对策41-44
4.4.1 Normapzed Cut算法41-42
4.4.2 改善的半监督聚类算法SSNCut42-44
4.5 实验及结果浅析44-51
4.5.1 实验数据集44
4.5.2 实验结果和浅析44-51
4.6 本章小结51-52
第五章 总结和展望52-53