设为首页  |  加入收藏
科研处
 首页 | 学术委员会 | 机构组织 | 学风建设 | 政策法规 | 科研立项 | 研究交流 | 学报 | 下载中心 
现在是:
站内检索  
 
当前位置: 首页>>学报>>正文
 
高校图书馆数字资源存储虚拟化研究
2014-04-08 12:35  


高校图书馆数字资源存储虚拟化研究

张玲

(榆林学院 图书馆,陕西榆林719000

 

摘要:高校图书馆正面临与日俱增的数字资源的存储需求,而虚拟存储技术正好可以解决这个难题。目前虚拟存储实现方式有三种,但还没有统一的标准,各图书馆应根据虚拟存储的发展趋势选择其实现方式。

关键词:虚拟存储;存储系统;数字资源

 

虚拟货币、虚拟社区、虚拟存储、虚拟现实及虚拟光驱等贴着“虚拟”标签的IT新名词不断刺激着信息管理者们。虚拟化的初衷就是为了帮助企业实现IT基础设施的共享、效率的提升和成本的降低。在越来越关注成本、效率、投资回报、IT整合的今天,虚拟化技术已经在国外很多关注成本和IT资源利用率的企业中普遍采用,“避实就虚”的IT应用新时代已经到来。

一、虚拟存储技术的特点与优势

虚拟化是一个广义的术语,在计算机方面通常是指计算元件在虚拟的基础上而不是真实的基础上运行。虚拟化技术可以扩大硬件的容量,简化软件的重新配置过程。CPU的虚拟化技术可以单CPU模拟多CPU并行,允许一个平台同时运行多个操作系统,并且应用程序都可以在相互独立的空间内运行而互不影响,从而显著提高计算机的工作效率。

虚拟化技术与多任务以及超线程技术是完全不同的。多任务是指在一个操作系统中多个程序同时并行运行,而在虚拟化技术中,则可以同时运行多个操作系统,而且每一个操作系统中都有多个程序运行,每一个操作系统都运行在一个虚拟的CPU或者是虚拟主机上;超线程技术只是单CPU模拟双CPU来平衡程序运行性能,这两个模拟出来的CPU是不能分离的,只能协同工作。

虚拟化技术也与目前VMware Workstation(一款功能强大的桌面虚拟计算机软件)等同样能达到虚拟效果的软件不同,是一个巨大的技术进步,具体表现在减少软件虚拟机相关开销和支持更广泛的操作系统方面。

虚拟存储提供了一个大容量存储系统集中管理的手段,由网络中的一个环节进行统一管理,避免了由于存储设备扩充所带来的管理方面的麻烦。无论后端采用何种物理存储设备,服务器及其应用系统看到的都是物理设备的逻辑映像。因此,系统管理员不必再关心后台采用何种设备,只要专注于管理存储空间即可。采用虚拟化技术以后,存储管理变得更简单。

虚拟存储大大提高存储系统整体访问带宽。存储系统是由多个存储模块组成, 而虚拟存储系统可以很好地进行负载平衡,把每一次数据访问所需的带宽合理地分配到各个存储模块中,这样系统的整体访问带宽就增大了。

虚拟存储技术为存储资源管理提供了更好的灵活性,可以将不同类型的存储设备集中管理使用,保障了用户以往购买的存储设备的投资。此外,虚拟存储技术还可以通过管理软件,为网络系统提供一些其它有用的功能。如无需服务器的远程镜像、数据快照(Snapshot)等。

二、 图书馆对虚拟存储的需求分析

图书馆,作为文献信息收藏单位,必须拥有丰富的数字馆藏资源,因此资源类型及保存的格式复杂多样。近年来,图书馆数字资源占图书馆馆藏的比重越来越大,数字图书馆已从概念发展到实际应用。

图书馆的数字化资源一般包括数字图书、数字期刊、数字古籍、多媒体视频数据等。国内提供数字图书资源的公司有:北京世纪超星公司,图书量已达80万册,容量为81338TB左右;北京书生之家公司,容量为5TB;北京国图,图书量为20万册,总容量为2TB;北大方正,数据容量1TB左右。数字期刊目前国内普遍采用的有三家,分别是清华同方、重庆维普公司和万方数字期刊,他们各自的电子期刊总容量都在1TB以上。就高校图书馆而言,一般都采购有几家的数字资源产品,数字资源总存储量在十几个TB左右,而且每年都会购买新的数字图书和数字期刊,新增存储容量也有数个TB。这种数据量的增加光靠购买新的设备是不可能的,与日益增长的存储需求相比,图书馆目前采用的管理工具和方法根本无法保持步调一致。IDCInternet Data Center,互联网数据中心)称,存储管理员的生产能力必须每年提高60%才能够控制好存储容量的增加。

在文件存储管理方面,通常有以下几个难题。在容量方面,存储设备的平均利用率为35%~50%;每TB的管理成本没有改善;容量超额配置成本太高。在性能方面,缓慢的响应时间影响用户生产力;I/O带宽限制应用吞吐量。分级存储方面,与在线存储相比,近线存储拥有巨大的成本优势,但是同时对在线存储和近线存储进行自动化管理常常受到限制。在存储整合方面,公司组织方面的要求给存储整合增加了难度,安全以及访问设置需要用户在存储整合时重新存放数据。

因此,需要一种新方法来简化网络存储的管理,这种新方法不应该增加存储管理的风险,同时不会影响用户原有的操作流程,对应用端则应该是透明的。存储虚拟化被认为是解决上述管理难题的有效方法,虚拟存储技术在图书馆的应用将会极大地推动数字图书馆的建设与发展。

三、虚拟存储的实现方式

一般而言,存储虚拟化的实现方式通常分为三种:交换架构虚拟化,磁盘阵列虚拟化以及整合到应用设备内的虚拟化。对于三种不同的虚拟化方式,存储供应商都有各自的“独门兵器”。IBM推出SVC (System Storage SAN Volume Controller)产品后,在存储虚拟化这一领域独占鳌头。HDS(日立数据系统有限公司)紧随其后发布了TagmaStore通用存储平台(USP),这是基于磁盘阵列的解决方案。EMC公司发布的Invista网络存储虚拟解决方案则是基于存储交换的解决方案。

由于虚拟化性能、应用程序灵活性以及虚拟化引擎等诸多方面的问题,早期的存储交换虚拟化和磁盘阵列虚拟化广受业界的质疑。最初执行虚拟存储的厂商依赖那些基于现有组件的分布式解决方案或是基于端口的处理引擎来提供所需功能,应用设备虚拟化方案被认为是最易于配置的,但其往往有应用限制。因此一些厂商更倾向于存储交换虚拟化,认为智能SAN虚拟化处理组件是下一代虚拟存储的典范。同样,HDS针对应用虚拟化方案和网络交换虚拟化方案也作出了类似的批评。HDS认为他们的通用存储平台(USP)是把虚拟化部署在存储网络边缘的存储控制器,而不是部署在主机或是网络核心的交换机或应用设备,他们认为从性能和安全因素上说这是最佳位置。而应用设备虚拟化的坚定支持者NetApp则认为通过应用设备在存储网络上实现虚拟化是最好方案。NetApp公司发言人解释:在选择磁盘阵列方案后,存储网络能给客户提供最大的灵活性,不至于像TagmaStore通用存储平台那样把客户锁定在磁盘阵列的解决方案,既不需要那么复杂,也不需要基于主机的虚拟化解决方案中客户代码带来的成本。在存储网络之内,应用设备可以灵活放置。这三种方案目前界限模糊,也可以说三种方式的结合才是最佳的实现方式。

四、 虚拟存储的发展趋势

尽管虚拟化技术为存储管理员带来了巨大便利,但是从目前情况来看,其仍然面临着诸多挑战。首先从技术层面来讲,存储虚拟化技术所面临的最大绊脚石就是不够成熟,虚拟化目前还不能完全脱离后端操作系统,这就意味着存储是“聚合的”而不是真正“共享的”。换句话说,虚拟化功能的实现目前还必须依赖NAS/文件服务器操作系统。

存储虚拟化虽然是IT界共同关注的热点,但它并不是什么新生事物,与它相关的卷管理器(Volume Managers)软件和RAID系统如今都已相当成熟。对于存储虚拟化技术来说,它在今天面对的真正趋势,就是要逐渐从物理层向服务层发展,目前有许多用户都在寻求具备这一特点的,可升级的存储解决方案。对此,Griffin商业管理服务公司的CTO Adrian Sunderland表示,基于iSCSIIP协议的虚拟化存储方案当属理想选择。

 

参考文献

[1]康健明.虚拟存储技术及其在数字图书馆中的应用\[J\].图书馆论坛,2007275):92-94.

[2] 旻,曲长生.高校数字图书馆存储方案设计及发展研究\[J\].现代情报,2008,(2):81-83.

[3]鲍智明.存储虚拟化在数字图书馆建设中的应用\[J\].情报探索,2005,(5):80-82.

 

上一条:浅析文学作品与影视传媒之关系
下一条:浅析文学作品与影视传媒之关系
关闭窗口

关于我们 | 反馈留言 | 帮助信息

陕西青年职业学院科研处  地址:西安市长安区常宁新区鱼包头街123号
电话:029-61289721  邮编:710100
ICP备案号:陕ICP备 05001405号