资源整合方案

一、 背景     

  伴随着数字图书馆建设的进程,以网络数据库、多媒体资源、数字期刊及电子图书为代表的数字资源激剧猛增。这些资源往往具有独立的数据库、检索环境和发布系统,给读者信息检索和资源利用造成了困难。具体表现为:用户对各种电子资源利用平台缺乏了解,需要反复熟悉方能使用;需要频繁穿梭于各个资源系统之间,进行登录、退出操作,浪费了大量时间;用户面对庞大的、多类型、多格式、多传递渠道的信息资源,身陷其中又无所适从。另一方面,图书馆、文献中心等单位,在某些学科具有权威地位并拥有丰富的学术成果和独具专题(地方)特色的馆藏资源,希望充分发挥这种资源优势,将文献数字化进程和现有的电子资源结合起来,建设具有权威性、独特性的专题特色数据库。馆藏资源如何进行数字化处理,怎样从已有的电子资源中抽取建设专题库所需的数据,如何将这些介质各异的资源整合起来建成专题特色数据库等都是需要解决的技术问题。这些问题是数字图书馆建设中整合现有异构电子资源,建立专题特色数据库的瓶颈问题。只有对现有资源内容高度分散、格式异构、利用率极度低下的现状进行深层处理(即对数据对象、功能结构及其互动关系进行融合、类聚和重组等再加工整合),形成一个效能更好、效率更高、功能更强的新资源体系,才能达到资源整体应用水平提高和实现知识服务自动化的目的。北京新星快威数码技术有限公司(简称:快威数码公司),是一家专门为数字资讯机构(包括互联网站、数字图书馆、图书和科技情报、档案、文献单位等)整合现有异构电子资源,建立各行业特色数据库和各学科专题数据库,致力于为广大用户提供资源整合重组、数据库建设直至信息检索、发布、利用、内容管理和服务等一系列的解决方案、个性化的数字图书馆建设方案、海量数据加工处理等高品质的售前技术支持与售后服务的高新技术企业。公司建立了三个软件研发基地,聚合了由多名国内计算机领域的高级专家、教授和博士、硕士领衔的一支50多名软件开发精英组成的专业技术团队,拥有一支熟悉和把握行业发展态势、服务周到热情、专业技术娴熟的经营和技术服务专业人员队伍。成功开发的具有自主知识产权的DIPS数字文献处理系统及系列辅助工具,具备了整合现有异构电子资源,为各机构创建特色专题数据库的整体技术实力。公司还建有专业从事数据处理的加工基地,是整合现有异构电子资源、创建特色专题数据库的实施保障。快威数码公司已帮助100多家政府部门、科研院所、大专院校和中小学图书馆及多个行业的大型企业集团实现了整合异构电子资源,建立了他们所要求的特色数据库和各学科专题数据库,积累了大量的电子资源整合经验,也充分证明了从底层整合异构电子资源,建专题特色数据库工程的必要性和可行性。快威数码公司自主研发的DIPS系统是以全文检索技术为基础,以内容管理为核心,集资源数字化加工、数字信息采集、挖掘、整理,数据库建设、管理、内容发布、检索、利用于一体的数字图书馆建设基础平台软件。DIPS系统是在2000年应高校数字图书馆建设自建特色数据库的需求而开发,经过8年多的发展,已有100多家用户的实际使用并进行了不断改进升级,日臻完善。该系统在国内率先提出图文相关联的理念并成功实现了“图文数据库”技术,解决了图像文献不能进行内容检索的难题,随后又进一步实现了支持基于PDF格式文档的全息数据库,做到检索直接命中到页并能标注显示检索结果。近年来,我们又紧紧围绕国家级用户、重点高校用户和部分专业用户,利用现有国内外电子资源,建设特色(专题)资源数据库等实际需求进行了功能扩展性开发,完成了以全文检索为基础,基于互联网内容管理概念的新一代数字图书馆核心系统的开发。在此基础上,还开发了“资源下载”、“资源格式转换”、“数据查重去重”、“资源挑选重组”、“数据合并”等系列辅助工具,以及配合DIPS系统资源再利用所需的《网络发布系统》、《个人资料系统》、《数据光盘制作系统》等系列应用系统。我们将持续改进完善DIPS数字文献处理系统,不断开发出满足用户参考咨询服务智能化、信息利用服务个性化等需求的产品,方便广大新老用户进行资源挖掘、异构资源的整合重组、特色专题资源库建设,为共建共享新一代电子资源提供优秀平台、技术支持和资源开发利用服务。    

二、整合流程   

        


三、优势和意义  

 1、专业性强。根据学科、专业或个性化要求来整合电子资源,所建立的特色(专题)数据库具有较强的专业性。

  2、资源质量大大提高。在整合过程中,由于剔除了大量重复、无用的信息垃圾,净化了资源环境,提高了有用知识的浓度。

  3、提升了知识关联功能。整合后的数字资源,具备了知识关联功能和自动化程度高的特点,有效地避免了用户在不同的网络环境和信息空间中来回穿梭和切换的麻烦,大大提高了检索速度,有效地满足了用户对个性知识需求的即时性和自主性。

  4、实现了不同文献资源之间的沟通,最大限度地保持了知识体系的完整性。

  5、拥有统一的用户交互接口,提高了检索效率及资源使用率,响应速度快。

  6、便于文献管理单位做各方面的数字统计(访问量、使用率等),实时指导文献管理单位各环节的运作,增强单位科研能力和创新能力。

  总之通过整合,使整个数字资源环境得到了全面优化,从而为实现由信息服务到知识服务的转变奠定了基础,同时,也为构建“知识网络与知识服务网络”创造了更优越的条件。

   


四、运行环境 

本硬件环境:(根据具体数据适当调整) 
扫描仪:一般文档扫描仪即可,有条件要求高的可配备高速扫描仪;
服务器:PIV以上服务器,内存不少于512MB,一个可满足数据存储空间的独立硬盘或分区(数据加工过程的数据文件都存放在服务器),操作系统可使用的对换空间最好在100MB以上,局域网连接设备。
客户端:PⅢ以上个人电脑,256MB的扩展内存,适量的剩余硬盘空间,VGA或以上的显示器,一块网络适配卡。

基本软件环境
操作系统:服务器需要Windows NT4.0及以上如Windows 2000、Windows 2003等版本。客户端需要Windows 98及以上版本即可;
数据库: SQL2000 SP4以上版本;
浏览器:IE6.0及以上版本;
软件配置:OCR识别软件等;