《编辑案头》

| | | | 转寄

信望爱硬体的小小梦想

索引 | « 前篇 | 次篇 »

自从有了第二个小孩之后,我几乎没有多少时间可以参与网路的服事,唯一能做的就是好好的管理信望爱站的系统而已,而眼看自己越来越忙,而信望爱站的硬体即将迈入第二个年头,心中不免有些担心。根据以往的经验,硬体系统,尤其是硬碟系统,在第二年之后就会开始或多或少出现问题。

  我们一开始就知道硬碟系统是整个硬体稳定性的「罩门」,所以我们选定 IBM 的硬碟来购买(避开其他比较危险的厂牌),而且也使用了 DAT 来每天备份系统的资料。这样谨慎小心的背后原因,无非是因为以前吃过太多亏了。但,使用 IBM 的硬碟就能高枕无忧了吗?我想许多人都很清楚,该坏的还是会坏,硬碟的损坏只是早晚的事情而已,而我自己悲观的预估今年夏天应该就是我们的硬体系统遭遇相当大的挑战的时间(因为温度加硬体年纪)。

  这一阵子我在想,如果硬碟损坏,我们的技术人员有什么办法可以尽快修复?到底最糟糕的情况下信望爱站会当机多久?仔细评估下来,其实是相当令人担心的。主要是目前主要的紧急修复人力就是我自己,如果 BBS 的硬碟坏掉,状况又出现在上班时间,以我现在的忙碌状况,大概没有把握可以「立刻回机房处理」,而晚上回家,大概只有四个小时左右的时间可以处理,而硬碟损坏的处理,却又不一定是四个小时可以解决的。

  如果 WWW 主机(信望爱 BBS 站与信望爱全球资讯网)或 Life 主机(心灵小憩、教会机构与其他专案事工)硬碟坏掉,我必须立刻停掉 Tech 主机(技术同工测试专用),将 tech 的硬碟重新分割成 BBS 可以使用的状况,然后将磁带中的备份转出来到 tech 的硬碟上去,并作一些必要的系统调整与测试。这样的状况下,我预估四个小时大概可以完成。但是 tech 就必须停机,信望爱站的研发也就必须停止。而信望爱站大概要停机一天才能重新启动。

  接下来我必须去买新硬碟回来装(得要隔天我有空才能去电脑公司买),如果没货就必须等一段时间,这段时间如果再有硬碟损坏,那就没有办法拯救了。硬碟买回来,我大概又必须花四个小时来将 tech 重建,将信望爱站弄回来,当然,这难免又会造成一段时间的停机。
  这段时间我认真的思考这样的状况是否是信望爱站可以忍受或应该忍受的。目前信望爱站的硬体架构是假设我们的技术人员可以随时修复解决问题的设计,但随着技术人员的流失与繁忙程度增加,这样的设计恐怕是有问题的。所以我特别设计了一个「完美的信望站硬体架构」,当成我们的梦想与未来努力的方向,在此与大家分享。

  我们未来的网站,应该以「稳固的资料储存」配合「可快速替换的运算硬体」来架设。因此,我们需要:

1. 一个 RAID(编注),其中包含七个硬碟,三个给 BBS 用,三个给 Life 用,一个做备援使用。
2. 三部电脑,配备一致,可随时更替。一部BBS、一部Life,另外一部配备传统硬碟当研发与备援用(tech)。
3. 整个系统采用机架式,方便维修。

  这样,透过 RAID 的保护,除非有两个以上的硬碟损坏,信望爱站不至于立刻无法使用,而整个维修也就可以在不停机的状况下执行。这样任何一个硬碟坏掉的停机时间,都将由一天降低至零。采用机架式的架构,是希望能够提供更好的散热与维修效率。如果由目前的架构转换成「梦幻架构」,预估需要采购:

1. 一套 RAID(含七个硬碟):25万
2. 三套机架式电脑与机架:15万
3. 共计大约要40万元。

  这样的预算经费相当高昂(信望爱资讯中心一年的预算也不过一百万左右),如果要分期执行,倒是可以先用目前的电脑硬体,而先采购 RAID,未来等到信望爱站硬体进入第三年再更换电脑硬体。至于专线部分,目前已经有 ISDN 备援线路了,所以不会成为系统的瓶颈。

  呵呵!这个方案我想了很久,一直没有敢公布出来,也不敢提出预算(只要想到我们苦哈哈的全职同工,我就不想这样花钱)。但是我想我们的神是丰富的上帝,我现在把这个构想提出来,欢迎大家提供意见,如果成为大家的共识,我们就可以一起为我们的梦幻系统祷告,如果我们认为我们的站是最好的基督教网站之一,那我想我们没有理由不敢向上帝求适当的硬体的。

  好了,我已经把我心里的梦想说出来了,欢迎大家指教。如果计画成形,那也许就当一个专案来奉献吧!

(本文作者为信望爱资讯中心技术组负责人,本中心前任负责人,高雄医学大学电算中心主任)

编注:RAID 是什么?

  RAID 的中文意义是「磁碟阵列」,顾名思义,就是用许多颗磁碟组成的阵列,功能是可以让机器的资料储存经过特别的运算而存放在这许多颗磁碟上,这样不但可以使资料的储存速度加快,也可以在某一颗硬碟损坏的时候,主机仍然可以继续运转,不会当掉,之后再尽快找一段时间将新硬碟换装上,即可自动 Recover,一个好的磁碟阵列,在硬体的设计上甚至可以火线上(on line 作业)插拔换装新硬碟,完全不需停机处理。

  RAID 对于伺服器管理与防止重要的电脑业务停摆确实是方便又有效的装置,不过成本相当高,现在信望爱资讯中心的业务和资料将是必然的愈来愈庞大,不要说是使用 RAID,甚至使用高阶伺服器来作为主机都是有可能的。在信望爱正在进步的同时,我们不可能期待只有「软体」的成长,却没有足够的「硬体」来支撑,所以这样的规划,确实是需要的。