您的位置: turnitin查重官网> 图书馆 >> 情报管理 >词表基于领域本体图情博客语义搜索系统

词表基于领域本体图情博客语义搜索系统

收藏本文 2024-03-28 点赞:19139 浏览:83270 作者:网友投稿原创标记本站原创

摘要:随着Web2.0的迅猛进展,其中的怎么写作项目——Blog的网页数量急剧增加,如何在数以百万的Blog页面中找到主题相关的Blog网页成为博客检索的一个重要探讨内容。由于Blog网页资源的独特特点,普通的网页搜索引擎对Blog的检索效率不高,于是针对Blog页面的专业搜索引擎Blog搜索引擎诞生了。然而现有Blog搜索引擎技术有着一些不足,体现在以下三个方面:第一,现有对博客资源搜索的探讨未涉及到语义组织层面;第二,目前的Blog搜索引擎不支持语义查询扩展;第三,现在国内外的Blog搜索引擎检索结果都差强人意。目前尚无专门用于专业领域学术博客的语义搜索系统,探讨人员一般借助现存可用的通用网页搜索引擎等工具来实现检索。由此开发一个适用于某一领域学术博客的专业搜索系统将会给探讨人员的工作带来更多的方便。本论文以这一实际出发,基于自身所学知识,选择与专业相关的图情领域学术博客作为探讨对象,探讨了一种新的信息检索方式——图情博客语义检索,即以领域本体库作为概念支撑,以传统的面向句法和结构的关键词匹配转变为面向语义概念的推理,使整个博客资源的搜索上升到语义层面。笔者以语义信息描述、语义本体构建、语义检索几个方面对图情博客语义检索系统的关键不足进行了深入浅析和探讨,选择有代表性的图情博客资源作为实例对象,利用本体构建的策略,构建了图情领域本体,在此基础上,通过概念之间的语义联系,实现对图情博客资源的语义描述、图情博客语义检索系统的设计、构建和实现。该系统的测试结果表明,文中提出的博客资源语义检索方式与传统搜索引擎相比更能为用户提供准确的信息,说明语义检索能够满足用户语义层面的需要。本论文主要探讨内容如下:1、语义信息描述。本体是语义信息的描述基础,语义信息主要由语义类、语义属性、语义联系、语义规则和语义实例构成,而这和本体中的概念、概念属性、概念联系、规则和公理、本体实例对应;语义信息提取是本体实例化的一种重要形式,在语义信息描述方式被定义后,所有的类或概念、属性、联系将根据实际情况进行具体赋值,这个历程也可以称为本体实例化;本体是语义检索的构成基础之一,由于本体本身具有一定的推理功能,可以利用本体进行扩展查询,以而使检索结果更加全面。本论文引入本体概念描述图情博客资源,具体介绍了本体的功能、结构、构建策略和描述工具,浅析了几种构建策略和工具的利弊,选用七步法配合Protege(?)工具构建图情领域本体。2、领域本体知识库构建。由以上对语义信息描述的探讨可知,一个专业的领域本体的构建需要有改善的领域概念框架。本论文试图利用《中国图书馆分类主题词表》和《汉语叙词表》》中规范的叙词和联系来搭建图情领域本体的基本框架系统。由此,笔者浅析了叙词表和本体的联系和区别,指出其结构上的相似性,并阐述了基于叙词表向本体转换的可行性和必定性,提出了具体的转化步骤。在此基础上,进行图情领域本体的构建,给出了构建原则、步骤、本体结构和详细的构建实例,并通过设计算法实现形式化本体的生成和导出。然后设计并实现了以叙词表为基本框架的图情博客本体的语义检索系统。3、图情博客语义检索。语义检索的主要任务是以某一领域相关的非结构化信息、半结构化语义信息和结构化信息中提取语义实体和语义联系实例,并将结果存储到检索结果库中。对于图情学术博客这一有特殊结构形式的半结构化网页信息,通过建立原有结构和语义类及属性之间的映射联系,可以进行数字化处理。本论文探讨的语义检索是区别于传统关键词检索的,对检索条件、信息组织及检索结果都赋予了一定语义成份的新的检索方式。以语义信息检索的新方式出发,详细浅析和探讨了基于本体驱动的图情博客语义检索系统的总体结构以及详细功能模块设计,并对系统的功能进行了测试和评价,证明了本论文提出策略的可行性。由此证明了这种新的语义检索方式能够提升博客资源的利用率,更好的满足用户检索需求。最后,总结了本论文探讨中有着的不足,提出了后续探讨的方向和内容。本论文以叙词表为框架的图情博客领域本体构建策略探讨以及基于该领域本体的语义搜索引擎系统的设计、开发与实现是本论文的重点探讨内容和革新之处。该原型系统证明了基于叙词表构建博客领域本体并实现语义检索的可行性。文章详细设计了检索实例,对系统进行了测试,验证了系统检索效率的提升,对今后博客资源组织和语义描述有一定参考价值和现实作用。关键词:语义搜索论文图情博客论文领域本体构建论文知识组织论文叙词表论文

    摘要8-10

    ABSTRACT10-12

    第一章 绪论12-21

    1.1 论文探讨背景12

    1.2 图情Blog信息组织的探讨近况12-15

    1.2.1 国外的探讨近况12-13

    1.2.2 国内的探讨近况13-15

    1.3 论文探讨目的和作用15-16

    1.4 论文探讨内容16-18

    1.4.1 工作计划16

    1.4.2 探讨材料16

    1.4.3 探讨策略16-17

    1.4.4 探讨内容17-18

    1.5 论新18-19

    1.6 论文组织结构19-20

    1.7 本章小结20-21

    第二章 语义本体及运用21-38

    2.1 语义网检索21-25

    2.1.1 语义网概述21-23

    2.1.2 语义搜索23-25

    2.2 语义本体25-32

    2.2.1 本体溯源25-27

    2.2.2 本体描述语言27-32

    2.3 本体构建策略32-36

    2.3.1 常用构建策略32-34

    2.3.2 有着的不足34-36

    2.4 本体构建工具36-37

    2.5 本章小结37-38

    第三章 图情博客领域本体的构建38-58

    3.1 领域本体的概念38

    3.2 本体与叙词表的联系38-41

    3.2.1 叙词表概述38-39

    3.2.2 叙词表与本体的联系39-41

    3.3 叙词表到本体的转化41-42

    3.4 图情领域本体的构建42-51

    3.4.1 可行性浅析42-43

    3.4.2 基本原则43-44

    3.4.3 构建步骤44-47

    3.4.4 本体构成47-48

    3.4.5 构建历程48-51

    3.5 构建实例51-55

    3.5.1 图情领域本体的类或概念51

    3.5.2 图情领域本体的联系和函数51-52

    3.5.3 图情领域本体的属性52-54

    3.5.4 图情领域本体的公理54

    3.5.5 图情领域本体的实例54-55

    3.6 形式化本体(OWL)的生成55-56

    3.7 语义推理的实现56-58

    第四章 博客语义搜索模型58-63

    4.1 博客组织方式58-59

    4.1.1 博客内容自组织58

    4.1.2 树形目录浏览方式58-59

    4.1.3 搜索引擎方式59

    4.2 博客语义检索系统59-61

    4.2.1 博客语义检索框架结构59-60

    4.2.2 博客语义检索系统基本设计流程60-61

    4.3 博客语义检索系统的优越性61-63

    4.3.1 博客语义检索系统与传统检索系统的区别61-62

    4.3.2 博客语义检索系统优越性的体现62-63

    第五章 基于领域本体的博客语义搜索系统设计与实现63-84

    5.1 系统概述63-64

    5.1.1 系统介绍63

    5.1.2 系统的功能63-64

    5.2 开发工具64-66

    5.2.1 本体编辑工具Protege OWL—plugin 3.0版64-65

    5.2.2 分词工具ICTCLAS65-66

    5.2.3 语义剖析工具Jena66

    5.3 系统设计66-77

    5.3.1 系统的总体设计66-67

    5.3.2 系统的设计方式和结构67-69

    5.3.3 数据库设计69-71

    5.3.4 检索系统71-77

    5.4 系统测试77-84

    5.4.1 检索测试策略概述77-78

    5.4.2 测试集的构建78-81

    5.4.3 测试结果浅析81-84

    第六章 总结和展望84-87

    6.1 本论文工作总结84

    6.2 探讨的不足之处与展望84-87

copyright 2003-2024 Copyright©2020 Powered by 网络信息技术有限公司 备案号: 粤2017400971号