您的位置: turnitin查重官网> 图书馆 >> 图书史 >试谈利用SQL Server2000实现图书采访书目批量去重

试谈利用SQL Server2000实现图书采访书目批量去重

收藏本文 2024-03-04 点赞:17383 浏览:73313 作者:网友投稿原创标记本站原创

摘 要:简述SQL Server2000数据库的功能特点和讨论了图书采访人员利用SQL Server 2000数据库准确快速实现对数据批量去重的操作策略,从而提高图书采访工作的效率。
关键词:SQL Server2000;图书采访;批量去重
中图分类号:G253.1
1 引言
图书采访工作是图书馆文献资源建设的源头,是图书馆一切工作的基础,做好图书采访工作作用重大。想必许多采访人员在采访工作中都有过类似的经历,经常会以ISBN号为查重条件对多家出版社和书商提供的最新出版的电子图书目录进行批量去重,删除所有书目中重复的数据,只保留其中一条。大多数采访人员会利用馆内的自动化管理系统或者EXCEL进行该操作。对于小量的采访书目数据,可以利用图书馆自动化管理系统或者EXCEL进行数据去重,但是数据量较大时,就需要花费大量的时间,同时也可能会导致系统运转速度变慢甚至怎么写作器卡死,严重影响了馆内其他业务的正常开展。而SQL Server2000数据库可以很好地解决对大量书目批量去重的理由,采访人员只需要在普通PC电脑上安装运转SQL Server 2000数据库,然后进行简单的操作就能快速准确地实现海量采访书目的批量去重。

2 SQL Server2000简介

SQL Server 2000是一个关系数据库,是Microsoft公司推出的SQL Server 数据库管理系统的一个版本。SQL Server2000具有高性能设计、系统管理先进、强壮的事务处理功能和自主的SQL语言等功能优点。SQLServer2000以其内置的数据复制功能、强大的管理工具和开放的系统结构为广大的用户提供了一个出众的数据库平台。目前,SQL Server 2000有四个版本,分别是企业版、标准版、个人版和开发版。由于在数据去重中功能需求较低,我们可以选择标准版或者个人版。

3 SQL Server2000实现快速去重

利用SQL Server2000实现多家书商或出版社提供的采访书目批去重的基本原理是将采访书目整理成统一字段和格式后,全部导入到SQL Server2000的同一个数据库表中,新建一个存放去重后的书目的数据库表并进行索引设置,借助于SQL SERVER2000数据库强大的功能快速实现采访书目数据的去重存放到去重结果表中,使所有采访书目数据中重复的数据去掉,只保留其中的一条,最后根据所需的格式把书目导出即可。本文以两家书商提供的EXCEL格式采访数据为例,详细介绍具体的操作步骤。

3.1 整理采访书目

检测如我们有A和B两家书商提供的采访书目,去掉不含ISBN 的无效数据和不必要字段,有效字段可以命名为ISBN、题名、责任者、、出版社、出版日期等。所有表中的格式要一致,ISBN的格式和位数要统

一、如表1和表2所示:

从以上两个表中可以看出,A书商和B书商提供的采访书目存在重复的数据。现在要删除这些重复的数据,只保留其中的一条。

3.2 导入数据到到SQL Server2000

在SQL server2000的企业管理器中创建一个名称为”mybook”的数据库,在查询分析器中选择“mybook”数据库运转SQL语句:CREATE TABLE Book ([序号] float NULL, [ISBN] nvarchar (255) NULL, [题名] nvarchar (255) NULL, [作者] nvarchar (255) NULL, [] float NULL),即可生成一个名为“Book”的数据库表用来存放所有需要去重的书目,利用数据库的数据导入功能把所有EXCEL表格中的书目导入到 “Book” 数据库表中。

3.3 建立一张具有相同结构的表

在数据库中创建一个名称为“Book_temp”的数据库表,用来存放去重后的书目的数据库表。这个表的结构必须与存放原始数据的表格结构一致。在查询分析器中运转如下SQL语句:CREATE TABLE Book_temp ([序号] float NULL, [ISBN] nvarchar (255) NULL, [题名] nvarchar (255) NULL, [作者] nvarchar (255) NULL, [] float NULL),即可生成“Book_temp”表。

3.4 设置去重结果表

在企业管理器中找到数据库表“Book _temp”,单击鼠标右键,选择所有任务,选择管理索引,选择新建。在新建索引页面中作如下设置:索引名称填写“QC_ISBN”,在“ISBN”列选择前面复选框中打勾,在索引选项中的“唯一值”和“忽略重复的值”的复选框中打勾。

3.5 执行去重任务

在执行管理器中运转如下SQL语句:insert into Book _tempSelect * from Book。此时SQL Server会返回如下提示:怎么写作器: 消息 3604,级别16,状态 1,行 1已忽略重复的键。它表明书目去重结果表中不会有重复的行出现。“Book _temp”表存放的数据就是去重后的图书书目数据,将它导出所需要的格式文件即可。
这样就完成了对两个表中重复记录的删除。无论表有多大,它的执行速度都是相当快的,而且因为几乎不用写语句,所以它也是很安全的。上述策略中删除重复记录取决于创建唯一索引时选择的字段,在实际的操作过程中读者务必首先确认创建的唯一索引字段利用SQL Server2000实现图书采访书目批量去重由专注毕业论文与职称论文的www.udooo.com提供,转载请保留.是否正确,以免将有用的数据删除。
参考文献:
[1]王锋.基于SQL SERVER2000的文献采访若干应用[J].黄冈师范学院学报,2011(12):65-66.
[2]杨桦.SQL Server2000实用教程[M].清华大学出版社,2007(3).
[3]林成春,谭浩强.SQL Server2000数据库实用技术[M].中国铁道出版社,2008(9).
[4]陈秀红.浅谈怎样提高图书查重准确率[J].甘肃科技纵横,2013(02).
作者简介:庞贞禄(1982-),男,广西科技大学鹿山学院图书馆从事图书馆信息技术研究。
作者单位:广西科技大学鹿山学院,广西柳州 545616

copyright 2003-2024 Copyright©2020 Powered by 网络信息技术有限公司 备案号: 粤2017400971号