人人都是他自己的历史学家,Blog则是展现在网上的历史……

零距离观察千万亿次超级计算机

上一篇 / 下一篇  2008-06-26 09:08:18 / 个人分类:采访背后

6月17日,本报记者在IBM位于纽约郊区Poughkeepsie的研发中心,参观了刚刚调试成功的千万亿次超级计算机RoadRunner,从而得以零距离与这台人类历史上首台千万亿次计算机有了一次亲密接触。

可惜的是,IBM有严格的限制,不让我们带照相机进去,所以根本没办法拍照片。不过,能够得以在第一时间接触这个世界排名第一的超级计算机,还是觉得非常激动的。

到现场之后,其实反而没觉得有啥了。一大堆的刀片服务器集群,现场看着还有些乱。以致于到现场参观的我们这些记者都以为这里只不过是原型机。因为我们一直听说这个超级计算机是IBM跟Los Alamos实验室合作的,所以这个超级计算机应该在Los Alamos才对啊。

不过,在问了现场的工程师之后,才确定这里的这些服务器就是RoadRunner,只不过过一段时间就要搬到Los Alamos实验室去了。

这是IBM提供的图片,现场大概就这样子,比这个要乱一点。

据在场的IBM工程师介绍,这台超级计算机从立项到调试成功,耗费了大概3个月的时间,由于该超级计算机是为Los Alamos国家实验室定制,因此目前还没有加载任何的存储系统,不过其计算功能模块已经齐备。

RoadRunner拥有130536个计算核心,包括12960颗改进版的IBM Cell芯片的116640个PPE和SPE核心,以及6948颗双核心AMD Opteron。与IBM此前位居Top 500首位的蓝色基因不同,此次的RoadRunner采用了刀片服务器集群架构,利用Infiniband技术进行了连接。

记者在现场看到,整个RoadRunner由17个CU(Cluster Unit,集群单元)组成,每个集群又包含了16个机柜,每个机柜里面有4台刀片服务器。每台刀片服务器包含了3个混合节点,每个节点由一片LS21 AMD刀片加上两片Cell QS22刀片组成,分别配置了4颗Cell和2颗双核皓龙芯片,两种处理器使用PCI-E电缆连接在一起。而节点之间用Infiniband进行连接。

IBM公司Poughkeepsie研发中心

由于节点数目庞大,因此IBM将连接分成了两个层次,首先将其连接到第一层Infiniband交换机,然后再将其连接到第二层Infiniband交换机,以保证整个系统的可管理性。主计算任务由皓龙来完成,而Cell芯片起到加速处理的作用。

现场的工程师表示,他们从1个CU开始调试,然后逐步进行累加,直至达到Los Alamos国家实验室所要求的计算能力。实际上,他们总共搭建了18个CU,不过由于Los Alamos实验室的实际需要,他们只会安装17个CU进行运算。整个工程的造价达到了1.3亿美元,这也是全球第一台配置了Cell芯片的混合式超级计算机。它需要三种不同的编程工具,程序员们也必须仔细考虑如何让每个节点的十几个颗核心如何高效率地同时运行。

这是在IBM 公司Poughkeepsie分部的第二台玻璃主机z10。据说全球总共三台,我国北京中关村有一台,德国还有一台。网界博客Y+x l JXl.QQf+\


IBM Poughkeepsie

IBM Poughkeepsie

TAG:

Server祁谈 引用 删除 姜子牙   /   2008-07-29 15:59:27
原帖由帝led于2008-07-25 01:46:36发表
原帖由帝led于2008-07-25 01:33:02发表
一个刀片服务器插9块刀片??剩下的做standby?用bladecenter H还...

其实是这样的,我接下来可以贴出来。他采用的是QS22的CEll 刀片,而且Cell刀片是用来加速的,并不是Cell刀片的集群。每个刀片机箱里面的确是4U*3,就是4块刀片构成一个节点,一个机箱里面有3个节点,这每个节点包括1个双路双核皓龙的LS21计算模块,一个扩展模块,两个双路Cell芯片的QS22加速模块。总共四个,每个机箱这样就是12个刀片,如此才是正确的。
帝led的个人空间 引用 删除 帝led   /   2008-07-25 01:46:36
原帖由帝led于2008-07-25 01:33:02发表
一个刀片服务器插9块刀片??剩下的做standby?用bladecenter H还是bladecenter E(用H估计要用52U的柜子,...

自己找了资料看了下,每个节点用一个Infiniband模块连接,就是4U(刀片U)×3,每个刀片柜子插12片片子
帝led的个人空间 引用 删除 帝led   /   2008-07-25 01:33:02
一个刀片服务器插9块刀片??剩下的做standby?用bladecenter H还是bladecenter E(用H估计要用52U的柜子,IBM的图好像不是片机哦)
Server祁谈 引用 删除 姜子牙   /   2008-07-04 14:19:12
好像超级计算机,更新的没有那么快吧
bigrong的个人空间 引用 删除 bigrong   /   2008-07-01 22:41:36
对于一个只需要4年就要更新设备的市场来说,去想办法让这么多cpu协调运转的系统太不可行了。
突然觉得开发蠕虫,利用肉机的人是天才,不用一个个cu去调试,依然工作的超乎想象
淡月的个人空间 引用 删除 淡月   /   2008-06-27 00:29:30
那件T恤上的71比IBM三个字还抢眼.哈哈
Server祁谈 引用 删除 姜子牙   /   2008-06-26 18:31:38
不知道为什么,我的照片一片苦大仇深
淡月的个人空间 引用 删除 淡月   /   2008-06-26 10:58:02
实力雄厚啊.
 

评分:0

我来说两句

显示全部

:loveliness: :handshake :victory: :funk: :time: :kiss: :call: :hug: :lol :'( :Q :L ;P :$ :P :o :@ :D :( :)

Open Toolbar