《編輯案頭》

| | | | 轉寄

感謝 web、 life、tech過去的服務

索引 | « 前篇 | 次篇 »

常上本站的朋友,應該有感覺到這幾天有點怪怪的。信望愛的電腦硬體,主要有三台。各叫做 web、 life、tech 。

2008/1/3 (上星期四)一早8:00左右,技術人員tjy發現life RAID第一個硬碟壞掉,依照標準處理程序,這時機器正常運作。10:00 發現系統當機,派遣ksf去機房查看,發現life RAID第三個硬碟也亮紅燈損毀,緊急關機再開、等冷卻(同時禱告)後再開無效。信望愛站開站十年來從來沒遇到的悲慘事件就這樣發生了。

接下來,ksf拿著硬碟去找RAID廠商,幫忙看看能不能救回來,這時當然技術組人心惶惶,甚麼怪招都想過了:換硬碟機板、拿早上換下來的硬碟放上去救、把壞掉的硬碟資料複製出來......。

後來RAID廠商幫忙檢查出來原來是第三顆硬碟已經老舊,轉速無法跟上。便借給我們一個電力比較強大的新RAID機器,利用慣性原理,通電關掉,趁硬碟還在轉再通電,這樣就順利把硬碟啟動了(這裡省略了很多辛苦的測試過程,真的感謝RAID廠商)。於是決定先讓系統恢復運轉,並且提前購買預算要購買的新 RAID把資料轉過去,好還人家借用的RAID。

ksf把RAID拿回來插好後開機,發現系統還是打不開,因為在硬碟損壞的同時,已經有資料毀掉了。判斷這不是全面性的問題,應該只是一兩個檔案毀掉,所以就由tjy下班後慢慢一個一個檔案利用備援光碟救起來,經過了幾個小時還是沒辦法,看來狀況比想像中的嚴重。這時tjm回從台南趕到高雄機房來接力檢修,決定重灌系統,保留資料。

為了要保留最多的資料,做了幾次失敗的嘗試(壞得真嚴重),最後重新灌了系統才讓系統真正復原。大概檢查了一下資料,發現應該沒有大礙,就先這樣啟動。但是後來發現竟忘記備份虛擬主機的資料,於是又手工加上虛擬主機的資料,讓大部分的系統運作正常。這時已經是1月4日凌晨 4:30。

1月 4日下午1:00 ksf 已經拿到新的RAID,安裝在勉強能跑的life上,由tjm遙控把硬碟準備好。1月 5日早上9:00開始轉移資料,11:00轉移完成,由等在機房的tjy、ksf 接手利用復原光碟來讓新的RAID可以開機。11:30順利完成這項工作,目前life系統已經完全穩定。

由於新買的 raid也要更換BBS的RAID(這個RAID更老,常常出現錯誤的警報),所以我們也停止BBS機器系統運作,接上設備。1月6日晚上已全部更換完成。


基本上 web、 life、tech 三台已經不眠不休地服務本站,已經 run 跑了將近三年。他們即將跑完應跑的路,蒙主恩召。我們為著他們過去的努力服務,向上帝獻上感恩。也期許新的 web、 life、tech能肩負起服事這一代的使命。