网格计算
取消
显示结果 
搜索替代 
您的意思是: 

分享我的技巧 : 网格与分布式超级计算

mybabys
本科生

分享我的技巧 : 网格与分布式超级计算

  Cactus项目是一种集成的、通用的、开放源码的计算科学和工程问题解决环境,由德国Max Planck引力物理研究所牵头、德国和美国多个研究机构共同完成。



  该项目的最大特点就是:系统庞大、但应用界面简单。它允许用户将原来在个人计算机上开发的程序,转换成能够在虚拟的“网格计算机”上运行的并行程序;提供简单、抽象的API调用接口,屏蔽系统的复杂特性,从而简化用户界面,获得很强的可移置性。此外,它还具有先进的数字计算技术、自适应的网眼细化、并行I/O等许多先进的特征。该项目最为成功的应用实例就是在2001年超级计算会议上获得了Gordon Bell奖的数字相对论应用,即“黑洞模拟”试验,它用网格求解爱因斯坦相对论方程,并模拟出天体的运动规律,这是一个极具代表性的成功的网格高性能计算应用案例:首先它利用了网格所带来的巨大的计算能力,其次它提供了一个有多学科、多领域的专家学者共同参与、协同解决问题的平台。



  此项目共使用了四台分布在两个地方的并行计算机:三台位于美国NCSA,分别为具128、128和256个CPU的SGI Origin 2000(相互之间使用Gigabit以太网连接,带宽达到100MB/s);另一台位于美国加州的圣地亚哥超级计算中心SDSC的具1024个CPU的IBM Power-SP。NCSA和SDSC之间使用OC-12专线连接。试验中还曾尝试过只使用一台SGI Origin 2000(120个CPU)和IBM Power-SP(1020个CPU),并创下高达88%的惊人的使用效率。



  以上仅仅是网格在分布式计算中的一个成功应用,类似的实例还有很多,如:美国NSF的分布式万亿级设施TeraGrid,美国NASA的计算网格IPG以及欧洲网格计算应用验证平台EUROGRID。但我们也同时看到,在这种大规模的分布式计算中,目前还只是较适合于节点间通信较少的情况,因此,网格在分布式计算中的应用可以说有两大技术瓶颈:一是从并行优化出发,明确哪些问题才适用于此类通信量较少的网格分布式计算,以及针对可能的问题尽可能地改进算法以降低通信消耗;二是从网格中间件的角度出发,如何应对与解决相互间通信量大的问题,这也是对网格技术发展提出的一个新的要求。



  虽然网格的概念最初就是为了解决大规模的计算需求应运而生,是脱胎于分布式计算的,但也应看到在分布式计算及网格领域也不可避免地存在着软件发展大大迟滞于硬件技术发展的现象,目前随着cluster技术的成熟而使机器研制的门槛一再降低,越来越多的国产高性能计算机研制成功,但是硬件指标上去了,如何真正让这些机器发挥其最大的效用,这就是软件与应用所要回答与解决的问题了,基于此,我认为应该从三个方面来促进网格与分布式计算的发展,分别是形成国内高性能计算中心的联盟;降低应用门槛,发展多种应用;实现网格应用中的可视化。



  与此同时,我们也应清醒地看到,国内整体软件水平与世界先进国家的差距,谈及成熟与大规模的网络应用还为时尚早,此外,网格中间件更新速度的频繁(最新的Globus Toolkits版本是2004年2月14日推出的GT 3.2 Beta),伴随着网格中间件Globus Toolkits 3.0而提出的一系列新的诸如OGSA与OGSI等架构和体系在应用层面提供的支持还显得较为薄弱,网格环境下的用户管理以及AAA(Authorization/Authentication/Accounting)等问题至今也未找到较满意的解决方案等,也给我们开展大规模而稳定的网格应用开发带来了巨大的挑战。