您的位置: turnitin查重官网> 图书馆 >> 图书馆建筑学 >知识作技术研发和实践学位

知识作技术研发和实践学位

收藏本文 2024-02-14 点赞:5579 浏览:19793 作者:网友投稿原创标记本站原创

[摘要]认为信息技术的快速发展和应用,增强了海量数字化信息内容的处理能力,为各种知识怎么写作算法的研发应用创造了条件。以软件算法为核心的知识怎么写作系统具备无人值守、自动化运行的特点,可极大地提升学术探索和知识管理的效率,促进知识创新。在论述知识怎么写作技术研发与实践的基础上,对几项知识怎么写作技术与应用情况进行详细介绍。
[关键词]知识怎么写作D-Rank基于滑动窗口的低频特征部分匹配算法共词网络引文网络
[分类号]G250 TP29
数十年来,信息技术遵循摩尔定律高速发展着,目前,海量存储设备和高性能计算得到普遍应用。海量信息得以被深度挖掘和处理,大数据、高性能计算已经成为当前技术研究的重点。
1 信息技术夯实知识怎么写作自动化的基础
信息怎么写作机构的核心能力不在于所拥有的资源,而在于具备利用广泛的信息资源为用户创造价值的知识和能力,即知识怎么写作的能力。信息怎么写作机构开展基于分析和基于内容的参考咨询怎么写作被认为是典型的知识怎么写作。但传统的咨询怎么写作过程人工参与过多,怎么写作深度和广度都受到限制。广泛开展高水平的知识怎么写作还需遵循海量信息资源加高性能计算的思路,即基于海量信息利用算法研发自动化的知识怎么写作路线(为便于讨论,下文所称的知识怎么写作皆为自动化知识怎么写作)。实现这样的怎么写作需要硬件、海量信息和智能算法三个条件的成熟。其中硬件是构建知识怎么写作的物质基础,海量信息是构建知识怎么写作的原材料,智能算法是构建知识怎么写作的引擎。

1.1 硬件

影响知识怎么写作的主要硬件因素包括存储设备、CPU和网络。知识怎么写作依赖于海量数据,海量数据存储需要高性能的存储设备的存储能力。知识怎么写作的成果依赖于智能算法基于海量数据的计算,因此需要廉价且高性能的计算能力。同时,知识怎么写作的成果需要从怎么写作器传递给用户,因此需要高性能的通讯网络架起用户和知识怎么写作之间的桥梁。
当今的存储技术已经非常成熟,IBM等领先的存储系统研发机构推出的新型存储系统单体容量可达数百TB,并且具有很高的性价比。与此同时,高性能计算能力和网络也得到快速发展,国际TOP 500组织最近公布的最新全球超级计算机500强排行榜,位居榜首的日本超级计算机“京”的运算速度达到了每秒8162万亿次。中国互联网基础资源的发展使资源商更好地将知识怎么写作带给网络用户成为可能。截至2011年6月底,我国Ipv4地址数量为3.32亿,较2010年底增长19.4%。我们拥有的Ipv6地址全球排名第15位。国际出口带宽达到118226

1.45Mbps。这些均为知识怎么写作的发展创造了硬件条件。

1.2 海量信息

当前,纸本文献的数字化和基于数字化平台直接创造的数字化信息的积累也达到了非常可观的规模。以国家数字图书馆推广工程的建设为例,在数字资源建设方面,该工程计划到“十二五”末,数字资源总量达到10000TB,相当于26亿册图书,或926万小时视频。其中电子图书可达到200万种,电子期刊达到12000种,电子报纸2 000种,音频资源20万小时/100万首曲目,视频资源30万小时/150万部集。海量的品质信息得以数字化,网络化、数字化知识怎么写作成为“有源清渠”。

1.3 智能算法

搜集资料和整理、分析资料曾被视为科学研究最费时费力的工作,现在借助人工智能算法的力量,信息怎么写作人员可以为用户的这一过程提供直接的怎么写作和支持。通过智能搜索技术可以快速帮助用户找到所需要的信息,甚至借助文本挖掘等算法直接得出各种有价值的研究线索和提示信息。相信随着信息处理技术的发展,越来越多的人工智能算法会应用到信息怎么写作中,向用户直接提供各种知识怎么写作,直接辅助用户的科研创造过程。
2 知识怎么写作发展与应用
纵观数字化、网络化的图书馆情报信息怎么写作的发展,大致可以分为资源怎么写作、知识怎么写作、社区怎么写作三个阶段:
在资源怎么写作阶段,怎么写作方主要关注客户所需要的文献资源,以便能快速全面地满足用户的文献需求。
在知识怎么写作阶段,怎么写作方会利用计算机技术对资源进行特定的处理,开发形成这种特定知识怎么写作,满足用户的特定知识需求。下文所讲的知识脉络分析的怎么写作、论文相似性检测怎么写作和wolfram等都是基于资源加技术的思想研发的向用户提供知识怎么写作的代表。
在社区怎么写作阶段,怎么写作方会全面调动资源、技术和人等要素,建设三要素实现互动的互联网社区,并基于社区的互动面向用户提供怎么写作,满足用户全方位的需求。
3 知识怎么写作促进学术创新
信息怎么写作时代,信息怎么写作人员以购写和组织文献资源为主要工作,以满足用户的文献资源需求为最终怎么写作目标。知识怎么写作时代,信息怎么写作人员则将视角扩展到各种知识怎么写作技术,关注资源和技术两个方面,以满足用户的直接信息需求为怎么写作目标,借助各种知识怎么写作手段,参与用户搜集资料、整理资料和分析资料的全过程。
采用知识怎么写作手段,借助技术和算法的力量,大大提高了科研资料收集和整理的效率,根据人们的需要有针对性地组织和分析知识,解决用户最终信息需求。自动化的知识怎么写作可以实现7×24全天候怎么写作,通过网络,可以为任何联网用户提供怎么写作,没有了时间、空间的限制,怎么写作能力得到大幅提升。作为一种怎么写作,它的特点在于它是一种面向知识内容和解决方案的怎么写作,它的目的是提高科研学习效率和质量,促进学术创新。
4 几项知识怎么写作研发成果
北京万方数据股份有限公司(以下简称万方数据)在近20年的信息怎么写作中积累了千万量级的高品质学术信息资源,并拥有依托集群技术和分布式管理技术的网络化存储和高性能计算能力,笔者所在研发团队以此为基础,研发了万方数据知识怎么写作平台,并在其中推出了多项得到学术界好评的知识怎么写作成果。

4.1 D—Rank排序算法

检索是知识发现的重要手段,是一种基础的知识怎么写作,只有找到用户需要的信息才能提供进一步的怎么写作,因而检索质量的高低直接决定了知识怎么写作的优劣。排序是和检索技术密不可分的一项技术,高质量的排序是高质量检索的重要组成部分。检索本身解决的是匹配问题,对于检索命中的若干匹配结果进行显示,则是排序的问题。将与用户期望的结果最匹配的排在最前面,是每个检索系统追求的目标,其排序方案设计的优劣,直接影响用户

源于:查抄袭率本科www.udooo.com

的检索体验和效率。笔者所在团队研发了一款功能强大、高效的WFIRC检索引擎,内置D.Rank多指标文档排序算法,可实现千万量级文献数据基础之上的毫秒级检索排序响应。这种排序是根据文献两大类指标的不同权重算法设计实现的。
文献检索系统结果排序可使用的指标大体可分为两类:一类包括文献自身属性,比如都柏林核心集规范包括的题名(Title)、主题(subjeet)、日期(Date)、创建者(creator)等字段;一类是延伸属性,比如与检索表达式的相关度、文献所在刊物的外部评价级别(例如是否被某种索引工具收录,是否为核心期刊等)及文献被引用次数等。
基于网络搜索引擎排序算法和常用文献检索工具排序算法以及对文献排序属性的研究,D.Rank算法优选了可用的排序指标:在文献自身的属性中,D—Rank算法中优选了题名、创作者、时间等几个指标,这些指标能够比较全面地概括资源的主要特征,用户可以通过这些元素对资源进行检索和排序;在延伸属性中,优选的指标包括相关度、被引用次数、刊物级别、浏览次数和下载次数、作者级别、核心作者引用以及核心期刊引用等。这类指标能够较为深入地说明资源与用户的需求之间的匹配程度,并含有对资源质量的判断。
D-Rank排序算法结合文献的上述两类属性项目,采用综合指标排序算法,实现用户检索时希望得到最相关、文献质量最高、最新发表等隐性检索需求。具体地说,D.Rank包含两类排序:一类是单指标排序,另一类为多指标综合排序。单指标排序是指只采用单个属性项目进行排序的方法。多指标综合排序是指采用多个属性项目按照不同权重组合起来进行排序的方法。这里包含两个关键点,即采用哪些排序指标组合和每个指标所占的权重。D.Rank算法优选推荐了三种指标组合排序算法:
·按经典论文优先排序:使用文献被引用数、刊物级别、作者级别、核心刊引用、核心作者引用、相关度等作为排序指标,并且前5个权重设置较大,最后一个权重设置较小。按经典论文优先排序的效果是将相对比较新、和检索主题相关且是领域最权威、最重要的文献显示在检索列表的前面,以便于用户查阅领域内的经典文献。
·按新论文优先排序:使用时间、相关度、核心刊引用等作为排序指标,并且第一个权重比较大,其他权重较小。按新论文优先排序的效果是将和检索主题相关、在领域内相对权威和重要的且是新近发表的文献显示在检索列表的前面,以便于用户查阅领域内最新发表的值得查阅的文献。
·按相关度优先排序:使用相关度、被引用数、刊物级别等作为排序指标,并且第一个权重比较大,其他权重较小。按相关度优先排序的效果是发表时间相对较晚、在领域内相对权威和重要的且是和检索主题最相关的文献显示在检索列表的前面,以便于用户查阅限定领域内的文献,进行学习和综述研究等。

4.2 基于滑动窗口的低频特征部分匹配的论文相似性检测算法

长期以来,查重、抄袭、剽窃等科研失信行为在国内外学术界时有发生。这种失信行为不仅阻碍影响科学研究的正常进行,损害科学共同体的尊严,也破坏了学术发展的生态环境。如何遏制这种行为也是知识怎么写作研发的课题之一。
“基于滑动窗口的低频特征部分匹配算法。是笔者所在研发团队研发的一套基于概率论的创新型算法,具有检索速度快、检索效果准的特点。该款怎么写作系统已经得到了全面应用,收到了积极的效果。
·首先,它有利于改善科研管理工作。科技部部长万钢在“科研诚信与学风建设座谈会”上的发言中表示,科技部将在项目申报和成果验收中使用抄袭剽窃检测软件等技术手段,主动排查科研失信行为。
·其次,它能够发挥宣传教育作用。利用技术手段进行论文相似性检测,可增强学者们的学术规范意识,鼓励他们在科研活动中自觉遵循既

源于:论文提纲格式范文www.udooo.com

定的标准和规范。在所开展的论文相似性检测中,不当引用或引用不规范的情况占相当大的比例,这也说明了加强学术规范方面的教育与训练的重要性。
·再次,为期刊编辑人员提供实用的辅助工具。在抄袭剽窃检测软件出现之前,国内外许多负责任的学术期刊如果怀疑投稿属于一稿多投或存在剽窃行为,会采取人工搜索和比对的方式,或凭藉审稿人的经验进行验证和判断。反抄袭剽窃软件的开发应用,使编辑部的投稿检测方式发生了革命性的变化。尽管最后还是需要编辑人员和审稿人对论文是否确实存在剽窃问题进行定性,但无论是对可能存在问题的论文进行筛查还是对论文是否存在剽窃问题进行判断,技术手段都发挥了重要作用。
另外,该工具还可以促进知识产权保护。利用反抄袭剽窃软件,可以帮助作者或学术出版机构发现自己拥有版权作品的潜在的抄袭者,从而维护自己的知识产权。国际学术数据库也可以利用相关的技术手段维护学术期刊和作者的知识产权。
通过完善反抄袭剽窃技术和其他相关检测技术,进而扩大技术手段在学术出版和科研项目立项与成果验收中的应用,对于提高我国的科研水平和科研成果的质量有着重要意义。

4.3 基于共词网络和引文网络的知识脉络分析算法

《现代汉语词典》将知识定义为人类在改造世界的实践中所获得的认识和经验的总和。人类在认识和改造世界的过程中形成了各种知识,这些知识内容之间存在着内在逻辑关系。特定知识内容形成知识节点,若干知识节点内在的逻辑关联便构成网络化的知识体系,形成了知识网络。
在这种知识网络中,某个知识点作为一个知识网络节点,和其他相关知识点之间形成网络关系,节点与节点之间的距离代表知识点之间关联的紧密程度。在这样的知识网络中,从任意知识节点出发,都能找到和其临近的其他知识点。因为任何知识点都不可能是孤立的,甚至从任一知识点出发,都能遍历整个知识网络。但是这样的知识网络也存在一个问题,因为随着时间的发展,人类认知会进步,知识也会发展。因此,不同年度的知识网络应该具有不同的形状。
基于这样的认识,在知识网络的基础上增加时序分析的维度,就形成了知识脉络的概念。即为某一知识点在不同年代画出一张知识网络图,不同年代的网络图按顺序链接起来,形成某一知识点在不同年代的知识网络形状演变脉络图,简称为知识脉络。
知识脉络研究的理论较为丰富,对于计算机技术而言,可以实现自动化的主要有两种:一是共词网络分析法。由文章关键词及其共现关系形成的网络称为“共词网络”。每篇文献的关键词形成一组共现,一个关键词作为一个知识点,存在共现关系的关键词作为相关知识点;每共现一次,相应的关系权重对应增加,如此构建形成知识网络;然后根据时间维度拆分,即可形成知识脉络。二是引文网络分析法。引文网络即文献之间的引用关系形成的网络关系。对一篇文章的相关的知识点进行分析,并将这些知识点映射到引文网络中,通过合并相同知识点形成知识网络;然后增加文献发表时间,进而形成知识脉络。
基于以上研究,笔者所在研发团队研发实现了知识脉络分析怎么写作。该系统基于万方数据知识怎么写作平台收录的海量文献资源,通过基于共词网络和引文网络的分析方法,对知识脉络怎么写作进行了完整实现。
知识脉络从一个知识点出发,结合时间维度形成的脉络分析,对学术选题、学术研究等方面均有一定参考意义。它从时间维度揭示了知识点的关注度,有助于学者了解学科发展规律和研究选题。它基于时序揭示了知识点之间随时间变化的演化关系,有助于发现知识点之间的交叉、融合的演变关系,有助于学者发现新的研究方向、研究趋势和研究热点,是一项得到广大用户认可的知识怎么写作。
5 结语
信息技术的发展,硬件条件、海量数字化信息积累条件和智能算法条件的成熟,为知识怎么写作的发展创造了条件,笔者就工作经历总结了相关工作,今后一段时期必是各种知识怎么写作研发和应用的爆发期,各种知识怎么写作的成熟和规模化应用将极大地提高知识管理和学术探索的效率,促进知识的创新发展。
参考文献:
翁寿松,摩尔定律与半导体设备[J].电子工业专用设备,2002,31(4):196—199.
张晓林,走以用户为中、怎么写作驱动的发展模式[J].图书情报工作,1999(1):5—2.

copyright 2003-2024 Copyright©2020 Powered by 网络信息技术有限公司 备案号: 粤2017400971号